基于向量空间模型的有导词义消歧


Autoria(s): 鲁松; 白硕; 黄雄; 张健
Data(s)

2001

Resumo

词义消歧一直是自然语言理解中的一个关键问题,该问题解决的好坏直接关系到自然语言处理中诸多应用问题的效果优劣.由于自然语言知识表示的困难,在手工规则的词义消歧难以达到理想效果的情况下,各种有导机器学习方法被应用于词义消歧任务中.借鉴前人的成果引入信息检索领域中向量空间模型文档词语权重计算技术来解决多义词义项的知识表示问题,并提出了上下文位置权重的计算方法,给出了一种基于向量空间模型的词义消歧有导机器学习方法.该方法将多义词的义项和上下文分别映射到向量空间中,通过计算多义词上下文向量与义项向量的距离,采用k-NN(k=1)方法来确定上下文向量的义项分类.在9个汉语高频多义词的开放和封闭测试中均取得了突出的成绩(封闭测试平均正确率为96.31% ,开放测试平均正确率为92.98%),验证了该方法的有效性.

Identificador

http://ir.iscas.ac.cn/handle/311060/3158

http://www.irgrid.ac.cn/handle/1471x/66731

Idioma(s)

中文

Fonte

鲁松; 白硕; 黄雄; 张健.基于向量空间模型的有导词义消歧,计算机研究与发展,2001,38(6):662-667

Palavras-Chave #词义消歧 #向量空间模型 #义项矩阵 #上下文位置权重 #有导机器学习
Tipo

期刊论文