基于小规模尾字特征的中文命名实体识别研究


Autoria(s): 冯元勇; 孙乐; 张大鲲; 李文波
Data(s)

2008

Resumo

本文针对难度最大的两类命名实体(地名和机构名)在条件随机场框架下首次引入了小规模的常用尾字特征.实验表明,该特征与词类特征具有一定的互补性,联合使用可以以较小的训练代价显著提高专有名词的识别性能,特别是机构名的识别精度.该系统在我国863简体命名实体识别评测语料上专名(人名、地名和机构名)总体F1值达踞.76%,超过当年最佳系统8.63个百分点.在SIGHAN 2006命名实体识别语料上的结果也居于前列.

Identificador

http://ir.iscas.ac.cn/handle/311060/619

http://www.irgrid.ac.cn/handle/1471x/67488

Idioma(s)

中文

Fonte

冯元勇,孙乐,张大鲲,李文波.基于小规模尾字特征的中文命名实体识别研究.电子学报,2008,36(9):1833-1838

Palavras-Chave #中文命名实体识别
Tipo

期刊论文