基于单字提示特征的中文命名实体识别快速算法
Data(s) |
2008
|
---|---|
Resumo |
近年来条件随机场(CRF)模型在自然语言处理中的应用越来越广泛。标准的线性链(Linear-chain)模型一般采用L—BFGS参数估计方法,收敛速度慢。本文在分析模型复杂度的基础上提出了一种改进的快速CRF算法。该算法通过引入小规模单字特征降低特征的规模,并通过在推理过程中引入任务相关的人工知识压缩Viterbi和Baum-Welch格搜索空间,提高了训练的速度。在中文863命名实体识别评测语料和SIGHAN06语料集上进行的实验表明,该算法在不影响中文命名实体识别精度的同时,有效地降低了模型的训练代价。 |
Identificador | |
Idioma(s) |
中文 |
Fonte |
冯元勇,孙乐,李文波,张大鲲.基于单字提示特征的中文命名实体识别快速算法.中文信息学报,2008,22(1):104-110 |
Palavras-Chave | #计算机应用 |
Tipo |
期刊论文 |