Investigando a combinação de técnicas de aprendizado semissupervisionado e classificação hierárquica multirrótulo
Contribuinte(s) |
Canuto, Anne Magaly de Paula CPF:00739803409 http://lattes.cnpq.br/8059198436766378 CPF:66487099449 http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4790093J8 Bedregal, Benjamin René Callejas CPF:90688384404 http://buscatextual.cnpq.br/buscatextual/visualizacv.do?id=K4781417E7 Dória Neto, Adrião Duarte CPF:10749896434 http://lattes.cnpq.br/1987295209521433 Carvalho, André Carlos Ponce de Leon Ferreira de CPF:45841888404 http://lattes.cnpq.br/9674541381385819 Pappa, Gisele Lobo CPF:03696195952 http://lattes.cnpq.br/5936682335701497 |
---|---|
Data(s) |
03/03/2015
21/11/2012
03/03/2015
25/05/2012
|
Resumo |
Data classification is a task with high applicability in a lot of areas. Most methods for treating classification problems found in the literature dealing with single-label or traditional problems. In recent years has been identified a series of classification tasks in which the samples can be labeled at more than one class simultaneously (multi-label classification). Additionally, these classes can be hierarchically organized (hierarchical classification and hierarchical multi-label classification). On the other hand, we have also studied a new category of learning, called semi-supervised learning, combining labeled data (supervised learning) and non-labeled data (unsupervised learning) during the training phase, thus reducing the need for a large amount of labeled data when only a small set of labeled samples is available. Thus, since both the techniques of multi-label and hierarchical multi-label classification as semi-supervised learning has shown favorable results with its use, this work is proposed and used to apply semi-supervised learning in hierarchical multi-label classication tasks, so eciently take advantage of the main advantages of the two areas. An experimental analysis of the proposed methods found that the use of semi-supervised learning in hierarchical multi-label methods presented satisfactory results, since the two approaches were statistically similar results A classificação de dados é uma tarefa com alta aplicabilidade em uma grande quantidade de domínios. A maioria dos métodos para tratar problemas de classificação encontrados na literatura, tratam problemas tradicionais ou unirrótulo. Nos últimos anos vem sendo identificada uma série de tarefas de classificação nas quais os exemplos podem ser rotulados a mais de uma classe simultaneamente (classificação multirrótulo). Adicionalmente, tais classes podem estar hierarquicamente organizadas (classificação hierárquica e classificação hierárquica multirrótulo). Por outro lado, tem-se estudado também uma nova categoria de aprendizado, chamada de aprendizado semissupervisionado, que combina dados rotulados (aprendizado supervisionado) e dados não-rotulados (aprendizado não-supervisionado), durante a fase de treinamento, reduzindo, assim, a necessidade de uma grande quantidade de dados rotulados quando somente um pequeno conjunto de exemplos rotulados está disponí- vel. Desse modo, uma vez que tanto as técnicas de classificação multirrótulo e hierárquica multirrótulo quanto o aprendizado semissupervisionado vem apresentando resultados favor áveis à sua utilização, neste trabalho é proposta e utilizada a aplicação de aprendizado semissupervisionado em tarefas de classificação hierárquica multirrótulo, de modo a se atender eficientemente as principais necessidades das duas áreas. Uma análise experimental dos métodos propostos verificou que a utilização do aprendizado semissupervisionado em métodos de classificação hierárquica multirrótulo apresentou resultados satisfatórios, uma vez que as duas abordagens apresentaram resultados estatisticamente semelhantes |
Formato |
application/pdf |
Identificador |
SANTOS, Araken de Medeiros. Investigando a combinação de técnicas de aprendizado semissupervisionado e classificação hierárquica multirrótulo. 2012. 214 f. Tese (Doutorado em Ciência da Computação) - Universidade Federal do Rio Grande do Norte, Natal, 2012. http://repositorio.ufrn.br:8080/jspui/handle/123456789/18690 |
Idioma(s) |
por |
Publicador |
Universidade Federal do Rio Grande do Norte BR UFRN Programa de Pós-Graduação em Sistemas e Computação Ciência da Computação |
Direitos |
Acesso Aberto |
Palavras-Chave | #Classificação multirrótulo #Classificação hierárquica multirrótulo #Aprendizado semissupervisionado #Multi-label classification #Hierarchical multi-label classification #Semi-supervised learning #CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
Tipo |
Tese |