Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes


Autoria(s): Arnaldo, Heloína Alves
Contribuinte(s)

Bedregal, Benjamin René Callejas

CPF:01518154379

http://lattes.cnpq.br/5580392803736306

CPF:90688384404

http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781417E7

Canuto, Anne Magaly de Paula

CPF:66487099449

http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790093J8

Santiago, Regivan Hugo Nunes

CPF:30680581200

http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790032Z4

Dimuro, Graçaliz Pereira

CPF:25925326091

http://lattes.cnpq.br/9414212573217453

Data(s)

17/12/2014

26/11/2014

17/12/2014

24/02/2014

Resumo

Data clustering is applied to various fields such as data mining, image processing and pattern recognition technique. Clustering algorithms splits a data set into clusters such that elements within the same cluster have a high degree of similarity, while elements belonging to different clusters have a high degree of dissimilarity. The Fuzzy C-Means Algorithm (FCM) is a fuzzy clustering algorithm most used and discussed in the literature. The performance of the FCM is strongly affected by the selection of the initial centers of the clusters. Therefore, the choice of a good set of initial cluster centers is very important for the performance of the algorithm. However, in FCM, the choice of initial centers is made randomly, making it difficult to find a good set. This paper proposes three new methods to obtain initial cluster centers, deterministically, the FCM algorithm, and can also be used in variants of the FCM. In this work these initialization methods were applied in variant ckMeans.With the proposed methods, we intend to obtain a set of initial centers which are close to the real cluster centers. With these new approaches startup if you want to reduce the number of iterations to converge these algorithms and processing time without affecting the quality of the cluster or even improve the quality in some cases. Accordingly, cluster validation indices were used to measure the quality of the clusters obtained by the modified FCM and ckMeans algorithms with the proposed initialization methods when applied to various data sets

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior

Agrupamento de dados é uma técnica aplicada a diversas áreas como mineração de dados, processamento de imagens e reconhecimento de padrões. Algoritmos de agrupamento particionam um conjunto de dados em grupos, de tal forma, que elementos dentro de um mesmo grupo tenham alto grau de similaridade, enquanto elementos pertencentes a diferentes grupos tenham alto grau de dissimilaridade. O algoritmo Fuzzy C-Means (FCM) é um dos algoritmos de agrupamento fuzzy de dados mais utilizados e discutidos na literatura. O desempenho do FCM é fortemente afetado pela seleção dos centros iniciais dos grupos. Portanto, a escolha de um bom conjunto de centros iniciais é muito importante para o desempenho do algoritmo. No entanto, no FCM, a escolha dos centros iniciais é feita de forma aleatória, tornando difícil encontrar um bom conjunto. Este trabalho propõe três novos métodos para obter os centros iniciais dos grupos, de forma determinística, no algoritmo FCM, e que podem também ser usados em variantes do FCM. Neste trabalho esses métodos de inicialização foram aplicados na variante ckMeans. Com os métodos propostos, pretende-se obter um conjunto de centros iniciais que esteja próximo dos centros reais dos grupos. Com estas novas abordagens de inicialização deseja-se reduzir o número de iterações para estes algoritmos convergirem e o tempo de processamento, sem afetar a qualidade do agrupamento ou até melhorar a qualidade em alguns casos. Neste sentido, foram utilizados índices de validação de agrupamento para medir a qualidade dos agrupamentos obtidos pelos algoritmos FCM e ckMeans, modificados com os métodos de inicialização propostos, quando aplicados a diversas bases de dados

Formato

application/pdf

Identificador

ARNALDO, Heloína Alves. Novos métodos determinísticos para gerar centros iniciais dos grupos no algoritmo fuzzy C-Means e variantes. 2014. 107 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2014.

http://repositorio.ufrn.br:8080/jspui/handle/123456789/18109

Idioma(s)

por

Publicador

Universidade Federal do Rio Grande do Norte

BR

UFRN

Programa de Pós-Graduação em Sistemas e Computação

Ciência da Computação

Direitos

Acesso Aberto

Palavras-Chave #Agrupamento de dados. Fuzzy C-Means. Inicialização dos centros de grupos. Índices de validação #Data clustering. Fuzzy C-Means. Cluster centers initialization. Validation indices #CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Tipo

Dissertação