Algoritmos de agrupamentos fuzzy intervalares e índice de validação para agrupamento de dados simbólicos do tipo intervalo


Autoria(s): Moura, Ronildo Pinheiro de Araújo
Contribuinte(s)

Bedregal, Benjamin René Callejas

CPF:0035445327

MOURA, Ronildo P. A.

CPF:90688384404

http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781417E7

Canuto, Anne Magaly de Paula

CPF:66487099449

http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790093J8

Carvalho, Francisco de Assis Tenório de

CPF:31876439491

http://lattes.cnpq.br/3909162572623711

Santiago, Regivan Hugo Nunes

CPF:30680581200

http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790032Z4

Data(s)

17/12/2014

27/11/2014

17/12/2014

21/02/2014

Resumo

Symbolic Data Analysis (SDA) main aims to provide tools for reducing large databases to extract knowledge and provide techniques to describe the unit of such data in complex units, as such, interval or histogram. The objective of this work is to extend classical clustering methods for symbolic interval data based on interval-based distance. The main advantage of using an interval-based distance for interval-based data lies on the fact that it preserves the underlying imprecision on intervals which is usually lost when real-valued distances are applied. This work includes an approach allow existing indices to be adapted to interval context. The proposed methods with interval-based distances are compared with distances punctual existing literature through experiments with simulated data and real data interval

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior

A Análise de Dados Simbólicos (SDA) tem como objetivo prover mecanismos de redução de grandes bases de dados para extração do conhecimento e desenvolver métodos que descrevem esses dados em unidades complexas, tais como, intervalos ou um histograma. O objetivo deste trabalho é estender métodos de agrupamento clássicos para dados simbólicos intervalares baseados em distâncias essencialmente intervalares. A principal vantagem da utilização de uma distância essencialmente intervalar está no fato da preservação da imprecisão inerente aos intervalos, pois a imprecisão é normalmente perdida quando as distâncias valoradas em R são aplicadas. Este trabalho inclui uma abordagem que permite adaptar índices de validação de agrupamento existentes para o contexto intervalar. Os métodos propostos com distâncias essencialmente intervalares são comparados a distâncias pontuais existentes na literatura através de experimentos realizados com dados sintéticos e reais intervalares

Formato

application/pdf

Identificador

MOURA, Ronildo Pinheiro de Araújo. An interval fuzzy clustering and validation index for clusteinf in interval symbolic data. 2014. 98 f. Dissertação (Mestrado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2014.

http://repositorio.ufrn.br:8080/jspui/handle/123456789/18111

Idioma(s)

por

Publicador

Universidade Federal do Rio Grande do Norte

BR

UFRN

Programa de Pós-Graduação em Sistemas e Computação

Ciência da Computação

Direitos

Acesso Aberto

Palavras-Chave #Matemática intervalar. Agrupamento de dados. Análise de dados simbólicos. Fuzzy c-Means. Distância intervalar #Interval mathematics. Clustering. Symbolic data analysis. Fuzzy c-Means i-metrics #CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Tipo

Dissertação