Generación automática de reglas de categorización de texto en un método híbrido basado en aprendizaje


Autoria(s): Lana Serrano, Sara; Villena Román, Julio; Collada Pérez, Sonia; González Cristóbal, José Carlos
Data(s)

2011

Resumo

En este artículo se evalúan diferentes técnicas para la generación automática de reglas que se emplean en un método híbrido de categorización automática de texto. Este método combina un algoritmo de aprendizaje computacional con diferentes sistemas basados en reglas en cascada empleados para el filtrado y reordenación de los resultados proporcionados por dicho modelo base. Aquí se describe una implementación realizada mediante el algoritmo kNN y un lenguaje básico de reglas basado en listas de términos que aparecen en el texto a clasificar. Para la evaluación se utiliza el corpus de noticias Reuters-21578. Los resultados demuestran que los métodos de generación de reglas propuestos producen resultados muy próximos a los obtenidos con la aplicación de reglas generadas manualmente y que el sistema híbrido propuesto obtiene una precisión y cobertura comparables a la de los mejores métodos del estado del arte.

Formato

application/pdf

Identificador

http://oa.upm.es/12322/

Idioma(s)

spa

Publicador

E.U.I.T. Telecomunicación (UPM)

Relação

http://oa.upm.es/12322/2/INVE_MEM_2011_111675.pdf

http://sinai.ujaen.es/sepln/ojs/ojs/index.php/pln/article/view/980

Direitos

http://creativecommons.org/licenses/by-nc-nd/3.0/es/

info:eu-repo/semantics/openAccess

Fonte

Procesamiento de Lenguaje Natural, ISSN 1135-5948, 2011, No. 47

Palavras-Chave #Telecomunicaciones #Informática
Tipo

info:eu-repo/semantics/article

Artículo

PeerReviewed