Contribuições a técnicas de agrupamento e visualização de dados multivariados utilizando mapas auto-organizáveis


Autoria(s): Silva, Leonardo Enzo Brito da
Contribuinte(s)

Costa, José Alfredo Ferreira

CPF:06060979459

http://lattes.cnpq.br/8092398102384904

CPF:53820126449

http://lattes.cnpq.br/9745845064013172

Martins, Allan de Medeiros

CPF:01979076448

http://lattes.cnpq.br/4402694969508077

Gorgonio, Flavius da Luz e

CPF:71459715420

http://lattes.cnpq.br/7375286161719016

Peres, Sarajane Marques

CPF:94364320978

http://lattes.cnpq.br/6265936760089757

Data(s)

17/12/2014

17/01/2014

17/12/2014

29/07/2013

Resumo

Self-organizing maps (SOM) are artificial neural networks widely used in the data mining field, mainly because they constitute a dimensionality reduction technique given the fixed grid of neurons associated with the network. In order to properly the partition and visualize the SOM network, the various methods available in the literature must be applied in a post-processing stage, that consists of inferring, through its neurons, relevant characteristics of the data set. In general, such processing applied to the network neurons, instead of the entire database, reduces the computational costs due to vector quantization. This work proposes a post-processing of the SOM neurons in the input and output spaces, combining visualization techniques with algorithms based on gravitational forces and the search for the shortest path with the greatest reward. Such methods take into account the connection strength between neighbouring neurons and characteristics of pattern density and distances among neurons, both associated with the position that the neurons occupy in the data space after training the network. Thus, the goal consists of defining more clearly the arrangement of the clusters present in the data. Experiments were carried out so as to evaluate the proposed methods using various artificially generated data sets, as well as real world data sets. The results obtained were compared with those from a number of well-known methods existent in the literature

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior

Os mapas auto-organizáveis (SOM) são redes neurais artificiais amplamente utilizadas no campo da mineração de dados, principalmente por se constituírem numa técnica de redução de dimensionalidade dada a grade fixa de neurônios associada à rede. A fim de particionar e visualizar adequadamente a rede SOM, os diversos métodos existentes na literatura devem ser aplicados em uma etapa de pós-processamento nos seus neurônios, visando inferir características relevantes do conjunto de dados. Em geral, tal processamento efetuado sobre os neurônios da rede, ao invés do conjunto de dados em sua totalidade, reduz o custo computacional, dada a quantização vetorial. Este trabalho propõe pós-processamentos dos neurônios da rede SOM nos espaços de entrada e de saída, aliando técnicas de visualização a algoritmos baseados na força gravitacional e na procura do menor caminho com maior recompensa. Tais métodos levam em consideração forças de ligação entre neurônios vizinhos e características de distâncias e densidade de padrões, ambas associadas a posição que o neurônio ocupa no espaço dos dados após o treinamento da rede. Dessa forma, busca-se definir mais nitidamente a disposição dos agrupamentos presentes nos dados. Experimentos foram realizados para avaliar os métodos propostos utilizando diversos conjuntos de dados gerados artificialmente, assim como conjuntos de dados do mundo real. Os resultados obtidos foram comparados com aqueles provenientes de alguns métodos bem conhecidos existentes na literatura

Formato

application/pdf

Identificador

SILVA, Leonardo Enzo Brito da. Contribuições a técnicas de agrupamento e visualização de dados multivariados utilizando mapas auto-organizáveis. 2013. 133 f. Dissertação (Mestrado em Automação e Sistemas; Engenharia de Computação; Telecomunicações) - Universidade Federal do Rio Grande do Norte, Natal, 2013.

http://repositorio.ufrn.br:8080/jspui/handle/123456789/15479

Idioma(s)

por

Publicador

Universidade Federal do Rio Grande do Norte

BR

UFRN

Programa de Pós-Graduação em Engenharia Elétrica

Automação e Sistemas; Engenharia de Computação; Telecomunicações

Direitos

Acesso Aberto

Palavras-Chave #Mapas auto-organizáveis. Mineração de dados. Técnicas de visualização. Algoritmos de agrupamento #Data mining. Self-organizing maps. Visualization techniques. Clustering algorithms #CNPQ::ENGENHARIAS::ENGENHARIA ELETRICA
Tipo

Dissertação