Uma nova forma de calcular os centros dos Clusters em algoritmos de agrupamento tipo fuzzy c-means


Autoria(s): Vargas, Rogerio Rodrigues de
Contribuinte(s)

Bedregal, Benjamin René Callejas

CPF:82923876091

http://lattes.cnpq.br/3688563150032671

CPF:90688384404

http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781417E7

Canuto, Anne Magaly de Paula

CPF:66487099449

http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790093J8

Santiago, Regivan Hugo Nunes

CPF:30680581200

http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790032Z4

Reiser, Renata Hax Sander

CPF:42930995068

http://lattes.cnpq.br/3283691152621834

Moraes, Ronei Marcos de

CPF:07946527861

http://lattes.cnpq.br/7925449690046513

Data(s)

17/12/2014

14/02/2013

17/12/2014

30/03/2012

Resumo

Clustering data is a very important task in data mining, image processing and pattern recognition problems. One of the most popular clustering algorithms is the Fuzzy C-Means (FCM). This thesis proposes to implement a new way of calculating the cluster centers in the procedure of FCM algorithm which are called ckMeans, and in some variants of FCM, in particular, here we apply it for those variants that use other distances. The goal of this change is to reduce the number of iterations and processing time of these algorithms without affecting the quality of the partition, or even to improve the number of correct classifications in some cases. Also, we developed an algorithm based on ckMeans to manipulate interval data considering interval membership degrees. This algorithm allows the representation of data without converting interval data into punctual ones, as it happens to other extensions of FCM that deal with interval data. In order to validate the proposed methodologies it was made a comparison between a clustering for ckMeans, K-Means and FCM algorithms (since the algorithm proposed in this paper to calculate the centers is similar to the K-Means) considering three different distances. We used several known databases. In this case, the results of Interval ckMeans were compared with the results of other clustering algorithms when applied to an interval database with minimum and maximum temperature of the month for a given year, referring to 37 cities distributed across continents

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior

Agrupar dados é uma tarefa muito importante em mineração de dados, processamento de imagens e em problemas de reconhecimento de padrões. Um dos algoritmos de agrupamentos mais popular é o Fuzzy C-Means (FCM). Esta tese propõe aplicar uma nova forma de calcular os centros dos clusters no algoritmo FCM, que denominamos de ckMeans, e que pode ser também aplicada em algumas variantes do FCM, em particular aqui aplicamos naquelas variantes que usam outras distâncias. Com essa modificação, pretende-se reduzir o número de iterações e o tempo de processamento desses algoritmos sem afetar a qualidade da partição ou até melhorar o número de classificações corretas em alguns casos. Também, desenvolveu-se um algoritmo baseado no ckMeans para manipular dados intervalares considerando graus de pertinência intervalares. Este algoritmo possibilita a representação dos dados sem conversão dos dados intervalares para pontuais, como ocorre com outras extensões do FCM que lidam com dados intervalares. Para validar com as metodologias propostas, comparou-se o agrupamento ckMeans com os algoritmos K-Means (pois o algoritmo proposto neste trabalho para cálculo dos centros se assemelha à do K-Means) e FCM, considerando três distâncias diferentes. Foram utilizadas várias bases de dados conhecidas. No caso, os resultados do ckMeans intervalar, foram comparadas com outros algoritmos de agrupamento intervalar quando aplicadas a uma base de dados intervalar com a temperatura mínima e máxima do mês de um determinado ano, referente a 37 cidades distribuídas entre os continentes

Formato

application/pdf

Identificador

VARGAS, Rogerio Rodrigues de. Uma nova forma de calcular os centros dos Clusters em algoritmos de agrupamento tipo fuzzy c-means. 2012. 98 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2012.

http://repositorio.ufrn.br:8080/jspui/handle/123456789/17949

Idioma(s)

por

Publicador

Universidade Federal do Rio Grande do Norte

BR

UFRN

Programa de Pós-Graduação em Sistemas e Computação

Ciência da Computação

Direitos

Acesso Aberto

Palavras-Chave #agrupamentos #centros dos clusters #ckMeans #fuzzy C-Means #dados intervalares #lógica fuzzy #ckMeans #cluster center #clustering #fuzzy C-Means #fuzzy logic #CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Tipo

Tese