Otimização em comitês de classificadores: uma abordagem baseada em filtro para seleção de subconjuntos de atributos
Contribuinte(s) |
Canuto, Anne Magaly de Paula CPF:05069886436 http://lattes.cnpq.br/8996581733787436 CPF:66487099449 http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790093J8 Dória Neto, Adrião Duarte CPF:10749896434 http://lattes.cnpq.br/1987295209521433 Carvalho, André Carlos Ponce de Leon Ferreira de CPF:45841888404 http://lattes.cnpq.br/9674541381385819 Gouvêa, Elizabeth Ferreira CPF:81652011749 http://lattes.cnpq.br/2888641121265608 Zanchettin, Cleber CPF:00551448962 http://lattes.cnpq.br/1244195230407619 |
---|---|
Data(s) |
17/12/2014
30/08/2012
17/12/2014
02/02/2012
|
Resumo |
Traditional applications of feature selection in areas such as data mining, machine learning and pattern recognition aim to improve the accuracy and to reduce the computational cost of the model. It is done through the removal of redundant, irrelevant or noisy data, finding a representative subset of data that reduces its dimensionality without loss of performance. With the development of research in ensemble of classifiers and the verification that this type of model has better performance than the individual models, if the base classifiers are diverse, comes a new field of application to the research of feature selection. In this new field, it is desired to find diverse subsets of features for the construction of base classifiers for the ensemble systems. This work proposes an approach that maximizes the diversity of the ensembles by selecting subsets of features using a model independent of the learning algorithm and with low computational cost. This is done using bio-inspired metaheuristics with evaluation filter-based criteria Conselho Nacional de Desenvolvimento Científico e Tecnológico A aplicação tradicional da seleção de atributos em diversas áreas como mineração de dados, aprendizado de máquina e reconhecimento de padrões visa melhorar a acurácia dos modelos construídos com a base de dados, ao retirar dados ruidosos, redundantes ou irrelevantes, e diminuir o custo computacional do modelo, ao encontrar um subconjunto representativo dos dados que diminua sua dimensionalidade sem perda de desempenho. Com o desenvolvimento das pesquisas com comitês de classificadores e a verificação de que esse tipo de modelo possui melhor desempenho que os modelos individuais, dado que os classificadores base sejam diversos, surge uma nova aplicação às pesquisas com seleção de atributos, que é a de encontrar subconjuntos diversos de atributos para a construção dos classificadores base de comitês de classificadores. O presente trabalho propõe uma abordagem que maximiza a diversidade de comitês de classificadores através da seleção de subconjuntos de atributos utilizando um modelo independente do algoritmo de aprendizagem e de baixo custo computacional. Isso é feito utilizando metaheurísticas bioinspiradas com critérios de avaliação baseados em filtro |
Formato |
application/pdf |
Identificador |
SANTANA, Laura Emmanuella Alves dos Santos. Otimização em comitês de classificadores: uma abordagem baseada em filtro para seleção de subconjuntos de atributos. 2012. 189 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2012. http://repositorio.ufrn.br:8080/jspui/handle/123456789/17946 |
Idioma(s) |
por |
Publicador |
Universidade Federal do Rio Grande do Norte BR UFRN Programa de Pós-Graduação em Sistemas e Computação Ciência da Computação |
Direitos |
Acesso Aberto |
Palavras-Chave | #Classificação de padrões #Comitês de classificadores #Diversidade #Seleção de atributos #Metaheurísticas bioinspiradas #Algoritmos genéticos #Colônia de formigas #Nuvem de partículas #Pattern classification #Ensembles #Diversity #Feature selection #Bio-inspired metaheuristics #Genetic algorithms #Ant colony #Particle swarm #CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::SISTEMAS DE COMPUTACAO |
Tipo |
Tese |