3 resultados para Anotación
em Universidade Complutense de Madrid
Resumo:
Predecir la función biológica de secuencias de Ácido Desoxirribonucleico (ADN) es unos de los mayores desafíos a los que se enfrenta la Bioinformática. Esta tarea se denomina anotación funcional y es un proceso complejo, laborioso y que requiere mucho tiempo. Dado su impacto en investigaciones y anotaciones futuras, la anotación debe ser lo más able y precisa posible. Idealmente, las secuencias deberían ser estudiadas y anotadas manualmente por un experto, garantizando así resultados precisos y de calidad. Sin embargo, la anotación manual solo es factible para pequeños conjuntos de datos o genomas de referencia. Con la llegada de las nuevas tecnologías de secuenciación, el volumen de datos ha crecido signi cativamente, haciendo aún más crítica la necesidad de implementaciones automáticas del proceso. Por su parte, la anotación automática es capaz de manejar grandes cantidades de datos y producir un análisis consistente. Otra ventaja de esta aproximación es su rapidez y bajo coste en relación a la manual. Sin embargo, sus resultados son menos precisos que los manuales y, en general, deben ser revisados ( curados ) por un experto. Aunque los procesos colaborativos de la anotación en comunidad pueden ser utilizados para reducir este cuello de botella, los esfuerzos en esta línea no han tenido hasta ahora el éxito esperado. Además, el problema de la anotación, como muchos otros en el dominio de la Bioinformática, abarca información heterogénea, distribuida y en constante evolución. Una posible aproximación para superar estos problemas consiste en cambiar el foco del proceso de los expertos individuales a su comunidad, y diseñar las herramientas de manera que faciliten la gestión del conocimiento y los recursos. Este trabajo adopta esta línea y propone MASSA (Multi-Agent System to Support functional Annotation), una arquitectura de Sistema Multi-Agente (SMA) para Soportar la Anotación funcional...
Resumo:
El estudio de las relaciones causales y su expresión lingüística ha sido comúnmente estudiado desde diferentes perspectivas en los años recientes. Sin embargo, pocos estudios han intentado combinar diferentes enfoques para establecer el significado de estas relaciones, y han investigado de manera contrastiva las señales usadas para expresarlas. Este trabajo de fin de master es un proyecto para avanzar el conocimiento en este área mediante la investigación de: a) la posibilidad de caracterizar las relaciones causales en diferentes tipos, usando características que combinan un enfoque funcional y cognitivo; b) los tipos de relaciones causales preferidas en los textos expositivos en inglés y sus traducciones al español; c) las expresiones lingüísticas preferidas para expresar dichas relaciones causales en los textos originales en inglés y sus traducciones al español. La metodología usada en esta investigación se basa en la anotación manual de un corpus bilingüe compuesto de un total de 37 textos expositivos (incluyendo los textos originales en inglés y sus traducciones al español) extraídos del corpus MULTINOT, un corpus de alta calidad, con registros diversificados y multifuncional bilingüe inglésespañol, actualmente compilado y anotado multidimensionalmente por los miembros del grupo de investigación FUNCAP con el proyecto MULTINOT (véase Lavid et al.2015) El estudio se llevó a cabo en cuatro pasos principales: primero, un esquema de anotación para las relaciones causales en inglés y español fue diseñado constando de tres sistemas interrelacionados y sus correspondientes características; tras ello, se compiló un inventario de señales para las relaciones causales en inglés y español, y una categorización en diferentes tipos; seguidamente, el esquema de anotación fue implementado en la herramienta UAM Corpus Tool y el conjunto de textos bilingües fue anotado por el autor de este estudio; finalmente, los datos extraídos de la anotación fueron analizados estadísticamente para comprobar las posibles diferencias entre los textos originales en inglés y sus traducciones al español respecto a la selección del tipo de relación de causa y sus señales. El análisis estadístico de los datos anotados sugiere que los tipos de relaciones de causa preferidos en los textos originales en inglés y son los tipos de contenido y no volitivos, que el orden de aparición de estos tipos de señales preferido es la segunda posición, y las señales más recurrentes usadas para expresar dichas relaciones son las conjunciones, seguidas de los sintagmas verbales. El análisis de las traducciones al español revela un alto grado de similitud con los datos de los textos originales en inglés, lo que sugiere que en las traducciones al español se conservan las preferencias de los textos originales en la mayoría de los casos y que estas elecciones pueden considerarse un indicativo de los textos expositivos en inglés. Proyectos futuros se centraran en el análisis de los textos originales en español para comprobar si las tendencias observadas en los textos originales en inglés y sus traducciones al español son también validas en textos originales en español, y en la especificación de patrones que puede ayudar al análisis automático de estas relaciones
Resumo:
El poeta nicaragüense Rubén Darío fue uno de los principales representantes del modernismo y uno de los escritores que han tenido mayor influencia en la literatura en lengua española de finales del siglo XIX y principios del XX. Su archivo personal, formado por más de 5.000 documentos, reúne materiales producidos entre los años 1893-1923 relativos a su actividad diplomática, a la literaria y a su vida personal. La tipología documental es muy variada: borradores, fotografías, cartas, notas manuscritas, postales, tarjetas de visita, testamentos, telegramas, recortes de prensa, oficios, facturas, menús, etc. Entre todos ellos podemos destacar el "cuaderno de hule negro" que contiene poemas autógrafos de Darío, dibujos infantiles y otros escritos relativos a su ámbito familiar más íntimo. Está inventariado dentro del Archivo con el nº 540, carpeta 6. Se trata de un cuaderno escolar, con tapas de hule, que llevó consigo Rubén Darío durante su viaje a Nicaragua de 1907 a 1908 y que trajo de regreso a España. Tanto las tapas de hule como las páginas acusan la acción del tiempo, así como la huella de otros usos, como el de servir de cuaderno de dibujo para su hijo Rubén Darío Sánchez "Güicho", ya de vuelta en el hogar, apreciándose dibujos infantiles, rayas y garabatos a lápiz en casi todas las páginas, incluso en la que contienen autógrafos de Darío. Faltan cuatro hojas al principio y las páginas han sido numeradas a posteriori. Las primeras 38 contienen una serie de composiciones poéticas autógrafas, completas e incompletas de Rubén, varios poemas editados, algunos de ellos con variantes entre las versiones autógrafas y las versiones impresas, tratándose de los primeros originales, y varios poemas y cinco estrofas de un poema inéditos. Destacan el "Poema de otoño" (páginas 1-11), incompleto, y el manuscrito original del poema "Canción otoñal" (páginas 13-14). Abriendo el cuaderno por el final (páginas 41-59) se observan páginas copiadas por Francisca Sánchez, en letra irregular, probablemente de un capítulo de la novela inédita de Darío "La isla del oro". Francisca fue la compañera del poeta desde 1899 y a ella la enseñaron a escribir el propio Darío y Amado Nervo. En la página 40 del cuaderno se observa una curiosa anotación de puño y letra de Darío con claves telegráficas para comunicarse Rubén y Francisca. Tras el fallecimiento de Rubén en 1916, Francisca Sánchez custodió el conjunto documental en un baúl en su hogar de Navalsaúz (Ávila) hasta 1956, cuando decidió donarlo al Ministerio Español de Educación Nacional. El archivo permaneció en la Facultad de Filología de la Universidad Complutense de Madrid hasta 2008. En esta fecha ingresó en la Biblioteca Histórica de la UCM, institución que alberga y da servicio público del Archivo actualmente