一种优化初始中心点的K平均文本聚类算法


Autoria(s): 赵万磊; 王永吉; 张学杰; 李娟
Data(s)

2005

Resumo

文本聚类在信息过滤,网页分类中有着很好的应用。但它面临数据量大,特征维度高的难点。由于K平均算法易于实现,对数据依赖度底,在文本聚类中得到应用。然而,传统K平均以及它的变种会产生有较大波动的聚类结果。因此对K平均算法进行了改进,通过优化聚类初始中心的选择,得到一种适合对文本数据聚类分析的改进算法。大量实验显示,该算法可以生成质量较高而且聚类质量波动性较小的结果。

Identificador

http://ir.iscas.ac.cn/handle/311060/3282

http://www.irgrid.ac.cn/handle/1471x/67552

Idioma(s)

中文

Fonte

赵万磊; 王永吉; 张学杰; 李娟.一种优化初始中心点的K平均文本聚类算法,计算机应用,2005,25(9):2037-2040

Palavras-Chave #优化 #文本聚类 #K平均 #optimize #document clustering #K-means
Tipo

期刊论文