Investigando a combinação de técnicas de aprendizado semissupervisionado e classificação hierárquica multirrótulo


Autoria(s): Santos, Araken de Medeiros
Contribuinte(s)

Canuto, Anne Magaly de Paula

CPF:00739803409

http://lattes.cnpq.br/8059198436766378

CPF:66487099449

http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790093J8

Bedregal, Benjamin René Callejas

CPF:90688384404

http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781417E7

Dória Neto, Adrião Duarte

CPF:10749896434

http://lattes.cnpq.br/1987295209521433

Carvalho, André Carlos Ponce de Leon Ferreira de

CPF:45841888404

http://lattes.cnpq.br/9674541381385819

Pappa, Gisele Lobo

CPF:03696195952

http://lattes.cnpq.br/5936682335701497

Data(s)

03/03/2015

21/11/2012

03/03/2015

25/05/2012

Resumo

Data classification is a task with high applicability in a lot of areas. Most methods for treating classification problems found in the literature dealing with single-label or traditional problems. In recent years has been identified a series of classification tasks in which the samples can be labeled at more than one class simultaneously (multi-label classification). Additionally, these classes can be hierarchically organized (hierarchical classification and hierarchical multi-label classification). On the other hand, we have also studied a new category of learning, called semi-supervised learning, combining labeled data (supervised learning) and non-labeled data (unsupervised learning) during the training phase, thus reducing the need for a large amount of labeled data when only a small set of labeled samples is available. Thus, since both the techniques of multi-label and hierarchical multi-label classification as semi-supervised learning has shown favorable results with its use, this work is proposed and used to apply semi-supervised learning in hierarchical multi-label classication tasks, so eciently take advantage of the main advantages of the two areas. An experimental analysis of the proposed methods found that the use of semi-supervised learning in hierarchical multi-label methods presented satisfactory results, since the two approaches were statistically similar results

A classificação de dados é uma tarefa com alta aplicabilidade em uma grande quantidade de domínios. A maioria dos métodos para tratar problemas de classificação encontrados na literatura, tratam problemas tradicionais ou unirrótulo. Nos últimos anos vem sendo identificada uma série de tarefas de classificação nas quais os exemplos podem ser rotulados a mais de uma classe simultaneamente (classificação multirrótulo). Adicionalmente, tais classes podem estar hierarquicamente organizadas (classificação hierárquica e classificação hierárquica multirrótulo). Por outro lado, tem-se estudado também uma nova categoria de aprendizado, chamada de aprendizado semissupervisionado, que combina dados rotulados (aprendizado supervisionado) e dados não-rotulados (aprendizado não-supervisionado), durante a fase de treinamento, reduzindo, assim, a necessidade de uma grande quantidade de dados rotulados quando somente um pequeno conjunto de exemplos rotulados está disponí- vel. Desse modo, uma vez que tanto as técnicas de classificação multirrótulo e hierárquica multirrótulo quanto o aprendizado semissupervisionado vem apresentando resultados favor áveis à sua utilização, neste trabalho é proposta e utilizada a aplicação de aprendizado semissupervisionado em tarefas de classificação hierárquica multirrótulo, de modo a se atender eficientemente as principais necessidades das duas áreas. Uma análise experimental dos métodos propostos verificou que a utilização do aprendizado semissupervisionado em métodos de classificação hierárquica multirrótulo apresentou resultados satisfatórios, uma vez que as duas abordagens apresentaram resultados estatisticamente semelhantes

Formato

application/pdf

Identificador

SANTOS, Araken de Medeiros. Investigando a combinação de técnicas de aprendizado semissupervisionado e classificação hierárquica multirrótulo. 2012. 214 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2012.

http://repositorio.ufrn.br:8080/jspui/handle/123456789/18690

Idioma(s)

por

Publicador

Universidade Federal do Rio Grande do Norte

BR

UFRN

Programa de Pós-Graduação em Sistemas e Computação

Ciência da Computação

Direitos

Acesso Aberto

Palavras-Chave #Classificação multirrótulo #Classificação hierárquica multirrótulo #Aprendizado semissupervisionado #Multi-label classification #Hierarchical multi-label classification #Semi-supervised learning #CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Tipo

Tese