基于标记的规则统计模型与未登录词识别算法
Data(s) |
2004
|
---|---|
Resumo |
该文针对小型词库,提出了基于规则统计模型的消歧方法和识别未登录词的词加权算法.通过大量语料库学习获取歧义高频字,作为歧义标记,利用规则统计模型对标记的上下文信息分类处理,剩下的部分进行正向或逆向动态最大匹配,对连续单字串使用词加权算法来判断其是否为未登录多字词.经过实验测试,该系统的准确率为98.88%,召回率为98.32%. |
Identificador | |
Idioma(s) |
中文 |
Fonte |
苏菲; 王丹力; 戴国忠.基于标记的规则统计模型与未登录词识别算法,计算机工程与应用,2004,40(15):43-45,91 |
Palavras-Chave | #歧义标记 #规则统计模型 #n元语法 #词加权算法 |
Tipo |
期刊论文 |