Caracterización de niveles de informalidad en textos de la Web 2.0


Autoria(s): Mosquera López, Alejandro; Moreda, Paloma
Contribuinte(s)

Universidad de Alicante. Departamento de Lenguajes y Sistemas Informáticos

Procesamiento del Lenguaje y Sistemas de Información (GPLSI)

Data(s)

07/09/2011

07/09/2011

01/09/2011

Resumo

El análisis de textos de la Web 2.0 es un tema de investigación relevante hoy en día. Sin embargo, son muchos los problemas que se plantean a la hora de utilizar las herramientas actuales en este tipo de textos. Para ser capaces de medir estas dificultades primero necesitamos conocer los diferentes registros o grados de informalidad que podemos encontrar. Por ello, en este trabajo intentaremos caracterizar niveles de informalidad para textos en inglés en la Web 2.0 mediante técnicas de aprendizaje automático no supervisado, obteniendo resultados del 68 % en F1.

Analysis of Web 2.0 texts is a relevant investigation topic nowadays. However, many problems arise when using state of the art tools in this kind of texts. For being able to measure these difficulties first we need to identify the different registers or informality levels that we can find. Therefore, in this paper we will attempt to characterize the informality levels of english texts in Web 2.0 by using non-supervised machine learning techniques, obtaining results of 68 % in F1.

Este artículo ha sido cofinanciado por el Ministerio de Ciencia e Innovación (proyecto TIN2009-13391-C04-01), y la Conselleria d’Educació de la Generalitat Valenciana (proyectos PROMETEO/2009/119, ACOMP/2010/286 y ACOMP/2011/001).

Identificador

MOSQUERA, Alejandro; MOREDA, Paloma. “Caracterización de niveles de informalidad en textos de la Web 2.0”. Procesamiento del Lenguaje Natural. N. 47 (2011). ISSN 1135-5948, pp. 171-177

1135-5948

http://hdl.handle.net/10045/18525

Idioma(s)

spa

Publicador

Sociedad Española para el Procesamiento del Lenguaje Natural

Direitos

info:eu-repo/semantics/openAccess

Palavras-Chave #Clustering #Registros del lenguaje #Web 2.0 #Language registers #Lenguajes y Sistemas Informáticos
Tipo

info:eu-repo/semantics/article