21 resultados para Explotación de corpus


Relevância:

20.00% 20.00%

Publicador:

Resumo:

It is almost 20 years since a series of conferences known as CULT (Corpus Use and Learning to Translate) started. The first and second took place in Bertinoro, Italy, back in 1997 and 2000, respectively. The third was held in 2004 in Barcelona, and the fourth in 2015 in Alicante. Each was organized by a few enthusiastic lecturers and scholars who also happened to be corpus lovers. Guy Aston, Silvia Bernardini, Dominic Stewart and Federico Zanettin, from the Universitá di Bologna; Allison Beeby, Patricia Rodríguez-Inés and Pilar Sánchez-Gijón, from the Universitat Autònoma de Barcelona; and Daniel Gallego-Hernández, from the Universidad de Alicante, organized CULT conferences in the belief that spreading the word about the usefulness of corpora for teaching and professional translation purposes would have positive results.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

En el Siglo XXI, donde las Nuevas Tecnologías de la Información y Comunicación están a la orden del día, se suceden manifestaciones que tradicionalmente abarcaban otros entornos menos virtuales y engloban grupos etarios desconocidos en los que la diferenciación de género es manifiesta. Con la facilidad de acceso y conexión a Internet, muchos disponemos de herramientas suficientes como para escribir en Redes Sociales determinadas emociones en su grado extremo así como ideaciones suicidas. Sin embargo, hay ubicaciones más profundas y desconocidas por algunos usuarios, como la Deep Web (y su navegador Tor), que permiten un completo anonimato del usuario. Por tanto, surge necesidad de la creación de un corpus de mensajes de índole suicida y relacionados con las emociones profundas con el fin de analizar el léxico mediante el lenguaje computacional y una previa categorización de los resultados con el fin de fomentar la creación de programas que detecten estas manifestaciones y ejerzan una labor preventiva.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

La lingüística cognitiva ha demostrado que la metáfora es una herramienta básica para la estructuración del pensamiento y la transmisión del conocimiento, ya que permite expresar algo desconocido en términos de algo conocido. De hecho, la metáfora está muy presente en el lenguaje de la vida cotidiana, pero también cumple una función muy importante en el ámbito de los lenguajes de especialidad. Es por esto que en el presente trabajo se ha abordado el tema de la metáfora en los textos de especialidad, y más concretamente, en los textos de divulgación médica sobre el cáncer. Para ello se han analizado los resultados obtenidos a partir de la explotación de un corpus comparable bilingüe (inglés-español) con la intención de comprobar si en ambas lenguas aparecían los mismos tipos de metáforas, tanto desde el plano de vista terminológico como del conceptual.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

The Web 2.0 has resulted in a shift as to how users consume and interact with the information, and has introduced a wide range of new textual genres, such as reviews or microblogs, through which users communicate, exchange, and share opinions. The exploitation of all this user-generated content is of great value both for users and companies, in order to assist them in their decision-making processes. Given this context, the analysis and development of automatic methods that can help manage online information in a quicker manner are needed. Therefore, this article proposes and evaluates a novel concept-level approach for ultra-concise opinion abstractive summarization. Our approach is characterized by the integration of syntactic sentence simplification, sentence regeneration and internal concept representation into the summarization process, thus being able to generate abstractive summaries, which is one the most challenging issues for this task. In order to be able to analyze different settings for our approach, the use of the sentence regeneration module was made optional, leading to two different versions of the system (one with sentence regeneration and one without). For testing them, a corpus of 400 English texts, gathered from reviews and tweets belonging to two different domains, was used. Although both versions were shown to be reliable methods for generating this type of summaries, the results obtained indicate that the version without sentence regeneration yielded to better results, improving the results of a number of state-of-the-art systems by 9%, whereas the version with sentence regeneration proved to be more robust to noisy data.