基于网络用户信息的个性化拼音输入法研究与实现


Autoria(s): 张顺昌
Contribuinte(s)

孙乐

Data(s)

04/06/2009

Resumo

汉字输入技术是中文信息处理领域特有的一项基础性关键技术,中文输入法是中文用户使用计算机必备的应用软件。依赖于键盘的中文输入法可以分为两大类:基于汉字字形和基于拼音的输入法。据统计,拼音输入法是计算机用户最常用的汉字输入工具。 在互联网高速发展的今天,随着Web2.0以用户为中心的网络环境的流行,普通用户已经成为信息的发布者,而这对中文输入技术提出了更高的要求。因此,在这个时代背景下,如何进一步提高中文输入法的效率成为一个既有挑战性又有实际应用价值的研究课题。我们在分析了现有拼音输入法的基础上,主要在以下几个方面做了一些研究:  实现了一个基于统计语言模型的音字转换系统。针对音字转换系统中基于字的统计语言模型的一些问题进行了研究,提出了利用更多上下文信息来改进语言模型的方法,最后设计实验进行了验证和分析。  改进了基于分层隐马尔可夫模型的音字转换解码方法。对音字转换中拼音流切分作了分析,发现拼音流切分存在歧义,而且这些歧义对音字转换的准确率存在较大影响,提出了利用统计语言模型辅助拼音流切分的方法,最后设计实验进行验证。  对网络用户常用的应用以及用户的个性化因素(用户的聊天记录,浏览历史,搜索引擎查询历史)进行了分析与研究,实现了基于网络用户信息的个性化拼音输入法,提高输入法系统性能和用户输入体验。

Identificador

http://ir.iscas.ac.cn/handle/311060/141

http://www.irgrid.ac.cn/handle/1471x/67271

Idioma(s)

中文

Fonte

张顺昌.基于网络用户信息的个性化拼音输入法研究与实现[硕士论文].北京.中国国科学院软件研究所.2009

Palavras-Chave #人工智能::自然语言处理 #中文输入 #拼音输入法 #音字转换 #统计语言模型 #个性化
Tipo

学位论文