基于统计的汉语词性标注方法的分析与改进


Autoria(s): 魏欧; 吴健; 孙玉芳
Data(s)

2000

Resumo

从词性概率矩阵与词汇概率矩阵的结构和数值变化等方面 ,对目前常用的基于统计的汉语词性标注方法中训练语料规模与标注正确率之间所存在的非线性关系作了分析 .为了充分利用训练语料库 ,提高标注正确率 ,从利用词语相关的语法属性和加强对未知词的处理两个方面加以改进 ,提高了标注性能 .封闭测试和开放测试的正确率分别达到 96.5%和 96% .

中国中文信息学会

Identificador

http://ir.iscas.ac.cn/handle/311060/4092

http://www.irgrid.ac.cn/handle/1471x/68190

Idioma(s)

中文

Fonte

魏欧; 吴健; 孙玉芳.基于统计的汉语词性标注方法的分析与改进,软件学报,2000,11(4):473

Palavras-Chave #词性标注 #n元语法 #语料 #语法属性
Tipo

期刊论文