基于图模型的信息检索技术研究及其应用
Contribuinte(s) |
孙乐 |
---|---|
Data(s) |
08/06/2010
|
Resumo |
信息检索与查询是网络用户最常用的网络服务之一。信息检索技术旨在帮助 用户在有限的时间内找到感兴趣的文档。近年来,基于语言模型的信息检索技术 因其良好的性能和较完备的理论基础而吸引了众多研究者。 文档模型和查询模型 的估计是影响语言模型信息检索系统性能的两个重要因素, 针对现有方法存在的 问题,本文从理论和实际应用两个方面开展了研究。主要工作总结如下: 第一、对目前统计语言模型信息检索技术进行了较为全面和深入的综述。从 相关度估计方法、文档模型和查询模型等方面,对目前语言模型信息检索研究工 作进行了分析,并对一些有代表性的工作进行了介绍。讨论了语言模型信息检索 技术在个性化搜索中的应用。最后基于上述研究现状的分析,给出了语言模型信 息检索未来值得研究的几个方向。 第二、提出一种基于局部词图的文档平滑方法。对于每个文档,我们获取这 篇文档最相似的K个文档,使用这K个文档和文档本身建立一个局部文档集L。在 这个局部文档集L上建立一个局部词图:节点为L中的词项,边为两个节点在L中 的同现次数。然后在这个词图上使用类似PageRank的排序方法计算节点的权重, 使用节点的权重估计文档模型。 在3个TREC数据集上的实验结果验证了该方法的 有效性。 第三、提出一种基于图的迭代增强个性化检索算法。利用文档与文档、文档 与词、词与词这三种相互增强关系来计算词的权值和检索结果文档的得分。并根 据词的权值进行查询扩展,根据文档的得分进行查询结果的重排序。通过查询扩 展可以丰富结果文档,并通过重排序把用户关注的个性化文档推荐给用户。实验 结果表明,本文提出的个性化检索算法能够有效地提高检索精度。最后,基于该 算法,我们实现了IE浏览器插件形式的个性化检索工具GBAIR。 |
Identificador | |
Idioma(s) |
中文 |
Fonte |
黄云平.基于图模型的信息检索技术研究及其应用[硕士].北京.中国科学院研究生院.2010 |
Palavras-Chave | #人工智能::自然语言处理 #信息检索 |
Tipo |
学位论文 |