基于标记的规则统计模型与未登录词识别算法


Autoria(s): 苏菲; 王丹力; 戴国忠
Data(s)

2004

Resumo

该文针对小型词库,提出了基于规则统计模型的消歧方法和识别未登录词的词加权算法.通过大量语料库学习获取歧义高频字,作为歧义标记,利用规则统计模型对标记的上下文信息分类处理,剩下的部分进行正向或逆向动态最大匹配,对连续单字串使用词加权算法来判断其是否为未登录多字词.经过实验测试,该系统的准确率为98.88%,召回率为98.32%.

Identificador

http://ir.iscas.ac.cn/handle/311060/2106

http://www.irgrid.ac.cn/handle/1471x/67866

Idioma(s)

中文

Fonte

苏菲; 王丹力; 戴国忠.基于标记的规则统计模型与未登录词识别算法,计算机工程与应用,2004,40(15):43-45,91

Palavras-Chave #歧义标记 #规则统计模型 #n元语法 #词加权算法
Tipo

期刊论文