Algoritmos de agrupamentos fuzzy intervalares e índice de validação para agrupamento de dados simbólicos do tipo intervalo
Contribuinte(s) |
Bedregal, Benjamin René Callejas CPF:0035445327 MOURA, Ronildo P. A. CPF:90688384404 http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781417E7 Canuto, Anne Magaly de Paula CPF:66487099449 http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790093J8 Carvalho, Francisco de Assis Tenório de CPF:31876439491 http://lattes.cnpq.br/3909162572623711 Santiago, Regivan Hugo Nunes CPF:30680581200 http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790032Z4 |
---|---|
Data(s) |
17/12/2014
27/11/2014
17/12/2014
21/02/2014
|
Resumo |
Symbolic Data Analysis (SDA) main aims to provide tools for reducing large databases to extract knowledge and provide techniques to describe the unit of such data in complex units, as such, interval or histogram. The objective of this work is to extend classical clustering methods for symbolic interval data based on interval-based distance. The main advantage of using an interval-based distance for interval-based data lies on the fact that it preserves the underlying imprecision on intervals which is usually lost when real-valued distances are applied. This work includes an approach allow existing indices to be adapted to interval context. The proposed methods with interval-based distances are compared with distances punctual existing literature through experiments with simulated data and real data interval Coordenação de Aperfeiçoamento de Pessoal de Nível Superior A Análise de Dados Simbólicos (SDA) tem como objetivo prover mecanismos de redução de grandes bases de dados para extração do conhecimento e desenvolver métodos que descrevem esses dados em unidades complexas, tais como, intervalos ou um histograma. O objetivo deste trabalho é estender métodos de agrupamento clássicos para dados simbólicos intervalares baseados em distâncias essencialmente intervalares. A principal vantagem da utilização de uma distância essencialmente intervalar está no fato da preservação da imprecisão inerente aos intervalos, pois a imprecisão é normalmente perdida quando as distâncias valoradas em R são aplicadas. Este trabalho inclui uma abordagem que permite adaptar índices de validação de agrupamento existentes para o contexto intervalar. Os métodos propostos com distâncias essencialmente intervalares são comparados a distâncias pontuais existentes na literatura através de experimentos realizados com dados sintéticos e reais intervalares |
Formato |
application/pdf |
Identificador |
MOURA, Ronildo Pinheiro de Araújo. An interval fuzzy clustering and validation index for clusteinf in interval symbolic data. 2014. 98 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2014. http://repositorio.ufrn.br:8080/jspui/handle/123456789/18111 |
Idioma(s) |
por |
Publicador |
Universidade Federal do Rio Grande do Norte BR UFRN Programa de Pós-Graduação em Sistemas e Computação Ciência da Computação |
Direitos |
Acesso Aberto |
Palavras-Chave | #Matemática intervalar. Agrupamento de dados. Análise de dados simbólicos. Fuzzy c-Means. Distância intervalar #Interval mathematics. Clustering. Symbolic data analysis. Fuzzy c-Means i-metrics #CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
Tipo |
Dissertação |