基于单字提示特征的中文命名实体识别快速算法


Autoria(s): 冯元勇; 孙乐; 李文波; 张大鲲
Data(s)

2008

Resumo

近年来条件随机场(CRF)模型在自然语言处理中的应用越来越广泛。标准的线性链(Linear-chain)模型一般采用L—BFGS参数估计方法,收敛速度慢。本文在分析模型复杂度的基础上提出了一种改进的快速CRF算法。该算法通过引入小规模单字特征降低特征的规模,并通过在推理过程中引入任务相关的人工知识压缩Viterbi和Baum-Welch格搜索空间,提高了训练的速度。在中文863命名实体识别评测语料和SIGHAN06语料集上进行的实验表明,该算法在不影响中文命名实体识别精度的同时,有效地降低了模型的训练代价。

Identificador

http://ir.iscas.ac.cn/handle/311060/621

http://www.irgrid.ac.cn/handle/1471x/67494

Idioma(s)

中文

Fonte

冯元勇,孙乐,李文波,张大鲲.基于单字提示特征的中文命名实体识别快速算法.中文信息学报,2008,22(1):104-110

Palavras-Chave #计算机应用
Tipo

期刊论文