Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes
Contribuinte(s) |
Bedregal, Benjamin René Callejas CPF:01518154379 http://lattes.cnpq.br/5580392803736306 CPF:90688384404 http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781417E7 Canuto, Anne Magaly de Paula CPF:66487099449 http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790093J8 Santiago, Regivan Hugo Nunes CPF:30680581200 http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790032Z4 Dimuro, Graçaliz Pereira CPF:25925326091 http://lattes.cnpq.br/9414212573217453 |
---|---|
Data(s) |
17/12/2014
26/11/2014
17/12/2014
24/02/2014
|
Resumo |
Data clustering is applied to various fields such as data mining, image processing and pattern recognition technique. Clustering algorithms splits a data set into clusters such that elements within the same cluster have a high degree of similarity, while elements belonging to different clusters have a high degree of dissimilarity. The Fuzzy C-Means Algorithm (FCM) is a fuzzy clustering algorithm most used and discussed in the literature. The performance of the FCM is strongly affected by the selection of the initial centers of the clusters. Therefore, the choice of a good set of initial cluster centers is very important for the performance of the algorithm. However, in FCM, the choice of initial centers is made randomly, making it difficult to find a good set. This paper proposes three new methods to obtain initial cluster centers, deterministically, the FCM algorithm, and can also be used in variants of the FCM. In this work these initialization methods were applied in variant ckMeans.With the proposed methods, we intend to obtain a set of initial centers which are close to the real cluster centers. With these new approaches startup if you want to reduce the number of iterations to converge these algorithms and processing time without affecting the quality of the cluster or even improve the quality in some cases. Accordingly, cluster validation indices were used to measure the quality of the clusters obtained by the modified FCM and ckMeans algorithms with the proposed initialization methods when applied to various data sets Coordenação de Aperfeiçoamento de Pessoal de Nível Superior Agrupamento de dados é uma técnica aplicada a diversas áreas como mineração de dados, processamento de imagens e reconhecimento de padrões. Algoritmos de agrupamento particionam um conjunto de dados em grupos, de tal forma, que elementos dentro de um mesmo grupo tenham alto grau de similaridade, enquanto elementos pertencentes a diferentes grupos tenham alto grau de dissimilaridade. O algoritmo Fuzzy C-Means (FCM) é um dos algoritmos de agrupamento fuzzy de dados mais utilizados e discutidos na literatura. O desempenho do FCM é fortemente afetado pela seleção dos centros iniciais dos grupos. Portanto, a escolha de um bom conjunto de centros iniciais é muito importante para o desempenho do algoritmo. No entanto, no FCM, a escolha dos centros iniciais é feita de forma aleatória, tornando difícil encontrar um bom conjunto. Este trabalho propõe três novos métodos para obter os centros iniciais dos grupos, de forma determinística, no algoritmo FCM, e que podem também ser usados em variantes do FCM. Neste trabalho esses métodos de inicialização foram aplicados na variante ckMeans. Com os métodos propostos, pretende-se obter um conjunto de centros iniciais que esteja próximo dos centros reais dos grupos. Com estas novas abordagens de inicialização deseja-se reduzir o número de iterações para estes algoritmos convergirem e o tempo de processamento, sem afetar a qualidade do agrupamento ou até melhorar a qualidade em alguns casos. Neste sentido, foram utilizados índices de validação de agrupamento para medir a qualidade dos agrupamentos obtidos pelos algoritmos FCM e ckMeans, modificados com os métodos de inicialização propostos, quando aplicados a diversas bases de dados |
Formato |
application/pdf |
Identificador |
ARNALDO, Heloína Alves. Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes. 2014. 107 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2014. http://repositorio.ufrn.br:8080/jspui/handle/123456789/18109 |
Idioma(s) |
por |
Publicador |
Universidade Federal do Rio Grande do Norte BR UFRN Programa de Pós-Graduação em Sistemas e Computação Ciência da Computação |
Direitos |
Acesso Aberto |
Palavras-Chave | #Agrupamento de dados. Fuzzy C-Means. Inicialização dos centros de grupos. Índices de validação #Data clustering. Fuzzy C-Means. Cluster centers initialization. Validation indices #CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
Tipo |
Dissertação |