Aplicaciones de procesamiento de lenguaje natural


Autoria(s): Hernández, Myriam; Gómez, José M.
Contribuinte(s)

Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos

Procesamiento del Lenguaje y Sistemas de Información (GPLSI)

Data(s)

28/10/2013

28/10/2013

01/07/2013

Resumo

El campo de procesamiento de lenguaje natural (PLN), ha tenido un gran crecimiento en los últimos años; sus áreas de investigación incluyen: recuperación y extracción de información, minería de datos, traducción automática, sistemas de búsquedas de respuestas, generación de resúmenes automáticos, análisis de sentimientos, entre otras. En este artículo se presentan conceptos y algunas herramientas con el fin de contribuir al entendimiento del procesamiento de texto con técnicas de PLN, con el propósito de extraer información relevante que pueda ser usada en un gran rango de aplicaciones. Se pueden desarrollar clasificadores automáticos que permitan categorizar documentos y recomendar etiquetas; estos clasificadores deben ser independientes de la plataforma, fácilmente personalizables para poder ser integrados en diferentes proyectos y que sean capaces de aprender a partir de ejemplos. En el presente artículo se introducen estos algoritmos de clasificación, se analizan algunas herramientas de código abierto disponibles actualmente para llevar a cabo estas tareas y se comparan diversas implementaciones utilizando la métrica F en la evaluación de los clasificadores.

The field of natural language processing (NLP) has grown tremendously in recent years, its research interests include: information retrieval and extraction, data mining, machine translation systems, question answering systems, automatic summarization, sentiment analysis, among others. In this paper we present some concepts and tools in order to contribute to the understanding of text processing with NLP techniques, to extract relevant information that can be used in a wide range of applications. Automatic classifiers can be developed to categorize documents and recommend labels, these classifiers should be platform independent, easily customizable in order to be integrated in different projects and to be able to learn from examples. In this article we introduce the algorithms for classification, we discuss some open source tools currently available to perform these tasks and different implementations are compared using F metrics to evaluate classifiers.

Este trabajo ha sido parcialmente financiado por el proyecto LEGOLANG (TIN2012-31224) y el proyecto TEXTMESS 2.0 (TIN2009-13391-C04- 01) del gobierno español.

Identificador

HERNÁNDEZ, M.; GÓMEZ, J. “Aplicaciones de procesamiento de lenguaje natural”. Revista Politécnica. Vol. 32, No. 1 (jul. 2013). ISSN 1390-0129, pp. 87-96

1390-0129

http://hdl.handle.net/10045/33514

Idioma(s)

spa

Publicador

Escuela Politécnica Nacional (Quito, Ecuador)

Relação

http://www.revistapolitecnica.epn.edu.ec/ojs2/index.php/revista_politecnica2/article/view/32

Direitos

Licencia Creative Commons Reconocimiento 3.0

info:eu-repo/semantics/openAccess

Palavras-Chave #Procesamiento de lenguaje natural #Clasificadores #Categorizar #Etiquetar #Aprendizaje supervisado #Aprendizaje no supervisado #Aprendizaje automático #Natural language processing #Classify #Categorize #Tagging #Supervised learning #Unsupervised learning #Machine learning #Lenguajes y Sistemas Informáticos
Tipo

info:eu-repo/semantics/article