Otimização em comitês de classificadores: uma abordagem baseada em filtro para seleção de subconjuntos de atributos


Autoria(s): Santana, Laura Emmanuella Alves dos Santos
Contribuinte(s)

Canuto, Anne Magaly de Paula

CPF:05069886436

http://lattes.cnpq.br/8996581733787436

CPF:66487099449

http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790093J8

Dória Neto, Adrião Duarte

CPF:10749896434

http://lattes.cnpq.br/1987295209521433

Carvalho, André Carlos Ponce de Leon Ferreira de

CPF:45841888404

http://lattes.cnpq.br/9674541381385819

Gouvêa, Elizabeth Ferreira

CPF:81652011749

http://lattes.cnpq.br/2888641121265608

Zanchettin, Cleber

CPF:00551448962

http://lattes.cnpq.br/1244195230407619

Data(s)

17/12/2014

30/08/2012

17/12/2014

02/02/2012

Resumo

Traditional applications of feature selection in areas such as data mining, machine learning and pattern recognition aim to improve the accuracy and to reduce the computational cost of the model. It is done through the removal of redundant, irrelevant or noisy data, finding a representative subset of data that reduces its dimensionality without loss of performance. With the development of research in ensemble of classifiers and the verification that this type of model has better performance than the individual models, if the base classifiers are diverse, comes a new field of application to the research of feature selection. In this new field, it is desired to find diverse subsets of features for the construction of base classifiers for the ensemble systems. This work proposes an approach that maximizes the diversity of the ensembles by selecting subsets of features using a model independent of the learning algorithm and with low computational cost. This is done using bio-inspired metaheuristics with evaluation filter-based criteria

Conselho Nacional de Desenvolvimento Científico e Tecnológico

A aplicação tradicional da seleção de atributos em diversas áreas como mineração de dados, aprendizado de máquina e reconhecimento de padrões visa melhorar a acurácia dos modelos construídos com a base de dados, ao retirar dados ruidosos, redundantes ou irrelevantes, e diminuir o custo computacional do modelo, ao encontrar um subconjunto representativo dos dados que diminua sua dimensionalidade sem perda de desempenho. Com o desenvolvimento das pesquisas com comitês de classificadores e a verificação de que esse tipo de modelo possui melhor desempenho que os modelos individuais, dado que os classificadores base sejam diversos, surge uma nova aplicação às pesquisas com seleção de atributos, que é a de encontrar subconjuntos diversos de atributos para a construção dos classificadores base de comitês de classificadores. O presente trabalho propõe uma abordagem que maximiza a diversidade de comitês de classificadores através da seleção de subconjuntos de atributos utilizando um modelo independente do algoritmo de aprendizagem e de baixo custo computacional. Isso é feito utilizando metaheurísticas bioinspiradas com critérios de avaliação baseados em filtro

Formato

application/pdf

Identificador

SANTANA, Laura Emmanuella Alves dos Santos. Otimização em comitês de classificadores: uma abordagem baseada em filtro para seleção de subconjuntos de atributos. 2012. 189 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2012.

http://repositorio.ufrn.br:8080/jspui/handle/123456789/17946

Idioma(s)

por

Publicador

Universidade Federal do Rio Grande do Norte

BR

UFRN

Programa de Pós-Graduação em Sistemas e Computação

Ciência da Computação

Direitos

Acesso Aberto

Palavras-Chave #Classificação de padrões #Comitês de classificadores #Diversidade #Seleção de atributos #Metaheurísticas bioinspiradas #Algoritmos genéticos #Colônia de formigas #Nuvem de partículas #Pattern classification #Ensembles #Diversity #Feature selection #Bio-inspired metaheuristics #Genetic algorithms #Ant colony #Particle swarm #CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO
Tipo

Tese