协同过滤推荐系统的标签网络整合及增量化


Autoria(s): 王哲
Contribuinte(s)

王永吉

Data(s)

08/06/2010

Resumo

随着信息过载问题越来越突出,如何有获地提取互联网上的信息成为近年来的一个研究热点。个性化推荐系统(Personalized Recommender System)利用用户的兴趣为其推荐最相关的互联网信息,已成功部署于搜索引擎、电子商务、网上社区等互联网关键应用中,是信息检索界的一个突破性的领域。个性化推荐系统的广泛商业应用对其性能提出了严格的要求,而数据的稀疏性和海量性 大大限制了推荐的质量。为了获得更高的准确性和可扩展性,协同过滤方法的 成功应用提供了一条解决之路。协同过滤的思想是利用兴趣相投、经验相似的 群体的喜好来为其内部成员推荐感兴趣的信息,用户通过如评分等的机制表现 自己的偏好以达到为自己和他人过滤信息的目的。作为目前最成功的推荐方法, 协同过滤的应用已经比较成熟。然而这种推荐系统仍有很大改进余地。 标签网络(Folksonomy)是一种最近兴起的社会网络资源,用户通过对浏览 过的物品进行注释或给予标签达到对其归类的作用。像这样对同一物品集合的给予标签的行为就形成这被称为标签网络的社会网络。协同过滤的思想无疑可以用于这些数据,为这些用户对这一物品集合内的元素给予推荐。将标签网络数据融入原基于评分的推荐系统,是我们的主要贡献之一。我们提出了两种具体地使用标签网络数据辅助评分预测的方法。一种是友邻方法,直接利用聚类方法寻找相似的用户或物品;另一种是联合矩阵分解,利用机器学习领域的矩阵分解拟合未知元素的方法预测评分。这两种方法的想法的初衷均来源于协同过滤技术面对的数据的一个棘手的特性,数据稀疏性。伴随着协同过滤的发展还有另外一个问题,那就是数量的巨大维度。对这一问题,我们提出了一种增量化方法使推荐系统适应目益增长的数据量。协同过滤方法中有一大类是利用聚类算法做出推荐,我们所提出的改进细化了聚类算法的粒度,使每次聚类都是有针对性地对小容量的集合进行操作。我们将改进的矩阵分解方法应用于每个集合的聚类操作上,使得相似的用户和物品之间的关系更加紧密。这在数据更新率很高的情况下可以避免不断重新将整个数据集进行训练的问题。我们通过实验对比了流行的若干种推荐算法,证明了我们所提出的方法均有着比较大的性能提升。不仅仅拥有更高的准确性,而且也拥有非常好的可扩展性(即算法时间复杂度与数据规模线性相关)。

Identificador

http://ir.iscas.ac.cn/handle/311060/2339

http://www.irgrid.ac.cn/handle/1471x/67306

Idioma(s)

中文

Fonte

王哲.协同过滤推荐系统的标签网络整合及增量化[硕士].北京.中国科学院研究生院.2010

Tipo

学位论文