基于组块及记忆的词性自动标注


Autoria(s): 石晶; 戴国忠
Data(s)

2006

Resumo

基于组块及记忆的模型(BMM)采用与传统方法明显不同的标注思路,以汉语中的整句为处理单元,从组块出发,立足于单个词汇,分析更为丰富的上下文语境知识,并借助知网词典记忆词性集合,同时采用渐增式的机械学习方式获取参数值。对于棘手的稀疏数据问题只简单地设置平伏常数加以平滑,最后利用少量人工规则修正标注结果。实验表明,该模型的封闭式测试准确率将近99%,开放式测试准确率为95%以上。

Identificador

http://ir.iscas.ac.cn/handle/311060/2220

http://www.irgrid.ac.cn/handle/1471x/68041

Idioma(s)

中文

Fonte

石晶; 戴国忠.基于组块及记忆的词性自动标注,吉林大学学报(工学版),2006,36(4):560-563

Palavras-Chave #人工智能 #词性自动标注 #基于组块及记忆的模型 #渐增式学习
Tipo

期刊论文