12 resultados para Procesamiento en lenguaje natural

em Universidade Complutense de Madrid


Relevância:

100.00% 100.00%

Publicador:

Resumo:

Hoy en día la cantidad de información de la que el mundo dispone es inmensa y la gran mayoría está al alcance de un click gracias a las tecnologías de la información. Muchos de los recursos que existen en Internet están escritos a mano por personas y para personas, pero este hecho tiene muchas limitaciones, como el idioma, el contenido, las expresiones en la comunicación o la disposición de la información en el texto. Todos estos factores influyen en el lector permitiendo entender mejor o peor los conceptos, relaciones e ideas que se expresan. Un ejemplo de un recurso muy utilizado a día de hoy es Wikipedia, que cuenta con más de cinco millones de artículos en inglés y más de un millón en otros doce idiomas entre los cuales se encuentran el castellano, el francés y el alemán. Por otro lado, existen otros recursos que aportan información de otras formas más interesantes desde el punto de vista de la informática, como pueden ser ConceptNet o WordNet. Las ventajas que ofrecen este tipo de recursos son que no disponen de varios lenguajes, es decir el conocimiento está unificado en uno solo, no tienen estructura de texto y se puede automatizar más fácilmente la inserción de nueva información, lo que se traduce en un crecimiento más rápido del conocimiento. Este tipo de recursos son ideales para su uso en aplicaciones informáticas gracias a que no es necesario un proceso de extracción de información de la fuente. Sin embargo, este tipo de información no está pensada para la lectura por parte de un humano, ya que se enfrentaría a muchos datos de golpe y sin un orden lógico para la comprensión, además de carecer de la conjugación propia o traducción a un idioma concreto. Este trabajo tiene como objetivo principal partir de un recurso de información no legible ni manejable por humanos e ideado para el uso por computadoras, y dar lugar a una interpretación de esta información que permita la lectura y comprensión en lenguaje natural por personas. Podemos verlo como un trabajo que posibilita y facilita el entendimiento Máquina-Hombre. Para ello se hace uso de un sistema de generación de lenguaje natural, inteligencia artificial y de la creatividad computacional. Además, este trabajo forma parte de un proyecto mayor, del que hablaremos en la sección 2.5, en el que se generan nuevos conceptos a partir de otros. El papel que desempeña esta aplicación permite describir los nuevos conceptos generados y poder entenderlos. A la hora de abordar el problema de la generación de texto podemos encontrar varias formas de atacar la cuestión, y todas las soluciones se pueden considerar como válidas. Se implementarán sistemas de diferente complejidad y naturaleza, como generadores básicos de textos o generadores con planificación y otras soluciones comunes en este campo como el uso de plantillas y el estudio de las propiedades de los textos generados por los humanos. Por esta razón, en este trabajo se desarrollarán varios métodos y se valorarán según ciertos criterios como la claridad del texto, su organización, o si se ha hecho un buen uso de la gramática o la ortografía. Como objetivos secundarios de este proyecto podemos remarcar la generación de un servicio web que permita que esté disponible la aplicación para su uso, y aporte valor tanto al mundo de la investigación como al del conocimiento. También se valora la semejanza a los generados por humanos.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Existe una cantidad enorme de información en Internet acerca de incontables temas, y cada día esta información se expande más y más. En teoría, los programas informáticos podrían beneficiarse de esta gran cantidad de información disponible para establecer nuevas conexiones entre conceptos, pero esta información a menudo aparece en formatos no estructurados como texto en lenguaje natural. Por esta razón, es muy importante conseguir obtener automáticamente información de fuentes de diferentes tipos, procesarla, filtrarla y enriquecerla, para lograr maximizar el conocimiento que podemos obtener de Internet. Este proyecto consta de dos partes diferentes. En la primera se explora el filtrado de información. La entrada del sistema consiste en una serie de tripletas proporcionadas por la Universidad de Coimbra (ellos obtuvieron las tripletas mediante un proceso de extracción de información a partir de texto en lenguaje natural). Sin embargo, debido a la complejidad de la tarea de extracción, algunas de las tripletas son de dudosa calidad y necesitan pasar por un proceso de filtrado. Dadas estas tripletas acerca de un tema concreto, la entrada será estudiada para averiguar qué información es relevante al tema y qué información debe ser descartada. Para ello, la entrada será comparada con una fuente de conocimiento online. En la segunda parte de este proyecto, se explora el enriquecimiento de información. Se emplean diferentes fuentes de texto online escritas en lenguaje natural (en inglés) y se extrae información de ellas que pueda ser relevante al tema especificado. Algunas de estas fuentes de conocimiento están escritas en inglés común, y otras están escritas en inglés simple, un subconjunto controlado del lenguaje que consta de vocabulario reducido y estructuras sintácticas más simples. Se estudia cómo esto afecta a la calidad de las tripletas extraídas, y si la información obtenida de fuentes escritas en inglés simple es de una calidad superior a aquella extraída de fuentes en inglés común.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Una de las tareas más comunes a las que se enfrentan los médicos es buscar historiales médicos, una tarea lenta y laboriosa que les arrebata tiempo útil. Este proyecto intenta reducir el tiempo dedicado a esa búsqueda permitiendo que, a partir del historial médico de un paciente, se encuentren otros casos similares dentro de la base de datos. Por eso, la base de datos con los documentos clínicos, en lenguaje natural en castellano, ha de ser procesada con las herramientas producidas por este proyecto. La aplicación está dividida en tres partes: la primera y la segunda se encargan de procesar los informes, dividiendo en campos y hallando los conceptos médicos respectivamente; la tercera parte es la que realiza las búsquedas de informes médicos similares.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Como enfoque global, se ha considerado que en la realización del lenguaje cooperan simultáneamente distintos órganos del cuerpo con sus correspondientes funciones; por tanto, el lenguaje es objeto de análisis desde diversas áreas científicas. Lo que nos ha inducido a abordar en nuestro trabajo algunos detalles significativos de distintos ámbitos de estudio. El objetivo principal ha sido analizar por qué la lectura de las noticias, en los medios audiovisuales, difieren ostensiblemente del lenguaje natural. Esa diferencia es percibida no sólo por la extraña entonación y segmentación errada de unidades fonológicas o sintácticas o por la acentuación impropia de palabras átonas, sino también por las diferentes características en los parámetros de la fonación. Para ello era preciso conocer los más importantes mecanismos del lenguaje espontáneo y, a partir de ese conocimiento, examinar qué elementos sufren alteración o desaparecen en el acto de la lectura con respecto al habla natural. La lectura es un acto en el que no intervienen los mecanismos biológicos innatos del ser humano, habitualmente presentes en el habla. En el habla, el pensamiento genera la palabra. Sin embargo, en la lectura, la palabra está ya escrita y por tanto no hay un proceso simultaneo con el pensamiento. Además, el mensaje que recibe el lector a través del grafismo y de los formatos en que se inscriben, constituye un elemento diferenciador del proceso natural. Los indicadores que recibe el lector son: elemento plano del papel y elemento lineal sin curvas de la escritura; formas que se transmiten instintivamente en la fonación. Y aunque en la lectura intervienen los órganos de fonación, no así otros muchos componentes de la movilidad corporal del habla como los brazos, las manos y los músculos del rostro, que son los que dirigen el sentido de la entonación y del ritmo...

Relevância:

100.00% 100.00%

Publicador:

Resumo:

En la sociedad actual, tenemos en alta estima a aquellas personas que demuestran tener un alto grado de creatividad, ya que implica la correcta aplicación de habilidades cognitivas que comúnmente consideramos reflejo de inteligencia. Con este proyecto, intentamos arrojar algo de luz sobre la creatividad computacional, concentrándonos en el ámbito de la generación automática de historias. Veremos los diferentes paradigmas existentes para la generación automática de historias, así como los sistemas previamente implementados, que nos han servido de referencia para completar el nuestro propio. Expondremos los detalles de nuestro sistema, un primer prototipo de un generador de historias capaz de valorar sus propios resultados, de forma que pueda filtrarlos para presentar los que considera mejores, además de poder cambiar completamente el contexto y el contenido de la historia de forma sencilla. Para ello, nos hemos basado en la generación de historias basada en gramáticas formales, con filtrado basado en un modelo generado previamente mediante aprendizaje máquina. Dicho modelo es generado a partir de las valoraciones de usuarios reales a historias generadas por el sistema para, posteriormente, analizar qué elementos de esas historias son los que desencadenan dicha valoración. De esta forma, estamos estudiando qué elementos hacen que una historia sea interesante para una persona, lo cual es especialmente interesante debido a la falta de consenso en este ámbito. A la hora de narrar las historias, hemos utilizado un enfoque basado en plantillas predefinidas por simplicidad, ya que la generación de lenguaje natural queda fuera del ámbito de este proyecto. Con todo esto, hemos conseguido implementar un generador de historias básico capaz, no sólo de generar un número muy elevado de historias diferentes, si no de valorar cuáles de esas historias son interesantes.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

En este Trabajo de Fin de Máster se desarrollará un sistema de detección de fraude en pagos con tarjeta de crédito en tiempo real utilizando tecnologías de procesamiento distribuido. Concretamente se considerarán dos tecnologías: TIBCO, un conjunto de herramientas comerciales diseñadas para el procesamiento de eventos complejos, y Apache Spark, un sistema abierto para el procesamiento de datos en tiempo real. Además de implementar el sistema utilizando las dos tecnologías propuestas, un objetivo, otro objetivo de este Trabajo de Fin de Máster consiste en analizar y comparar estos dos sistemas implementados usados para procesamiento en tiempo real. Para la detección de fraude en pagos con tarjeta de crédito se aplicarán técnicas de aprendizaje máquina, concretamente del campo de anomaly/outlier detection. Como fuentes de datos que alimenten los sistemas, haremos uso de tecnologías de colas de mensajes como TIBCO EMS y Kafka. Los datos generados son enviados a estas colas para que los respectivos sistemas puedan procesarlos y aplicar el algoritmo de aprendizaje máquina, determinando si una nueva instancia es fraude o no. Ambos sistemas hacen uso de una base de datos MongoDB para almacenar los datos generados de forma pseudoaleatoria por los generadores de mensajes, correspondientes a movimientos de tarjetas de crédito. Estos movimientos posteriormente serán usados como conjunto de entrenamiento para el algoritmo de aprendizaje máquina.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Uno de los aspectos que la investigación ha considerado esenciales en la enseñanza de la lengua escrita, es la Conciencia Fonológica (CF). Ha sido ampliamente aceptado que la CF puede ser un determinante crítico del éxito en la lectura. De acuerdo a Bravo (2002), el vínculo entre el desarrollo fonológico y el aprendizaje de la lengua escrita tiene lugar de tres maneras: a) como un desarrollo fonológico previo y predictivo; implica un umbral cognitivo a partir del que pueda iniciarse la decodificación, b) como una relación causal; el desarrollo fonológico es una condición previa que determina el posterior aprendizaje de la lectura y c) como un proceso interactivo y recíproco, durante el aprendizaje de la lectura el desarrollo fonológico tiene lugar siguiendo fases previas y posteriores. En consonancia, los enfoques más habituales o tradicionales de la enseñanza de la lengua escrita recuperan esta propuesta y por tanto, se abocan especialmente al desarrollo de habilidades fonológicas mediante la fragmentación de las palabras en sus componentes y la pronunciación constante de los sonidos de las letras. En contraste, el enfoque comunicativo funcional se centra en la práctica auténtica (real) y significativa (acorde con el contexto e intereses de quien aprende) de la lengua escrita para enseñar a leer y a escribir. No obstante, la investigación ha buscado la forma de conciliar la oposición entre los enfoques educativos anteriores proponiendo la combinación de las destrezas priorizadas por uno con los usos propuestos por el otro, estando en ello implícito: a) la hipótesis de que el desarrollo fonológico es un requisito para aprender a leer y a escribir, b) la idea de que el ejercicio mismo de la lectura y la escritura no tiene efecto en el desarrollo fonológico, y c) la concepción modular del procesamiento del lenguaje escrito, una de cuyas características es el encapsulamiento informativo...

Relevância:

100.00% 100.00%

Publicador:

Resumo:

La investigación que pretendemos llevar a cabo con esta tesis doctoral se centra en el estudio de la imagen fílmica de Madrid en el cine español. El constructo ciudad, dependiente del valor narrativo del espacio, plantea una serie de incógnitas que necesitan de un análisis en profundidad y que en el caso de nuestro estudio se articulan en torno a cuatro directores muy concretos que han convertido Madrid en centro de sus argumentos y obsesiones: Edgar Neville, Pedro Lazaga, Eloy de la Iglesia y Pedro Almodóvar. Los cineastas, pertenecientes a distintas generaciones y con disímiles puntos de vista, manifiestan en trabajos muy concretos la evolución y transformación del espacio urbano madrileño. La ciudad se erige por el momento en escenario natural de una gran parte de sus propuestas y, al mismo tiempo, como podemos evidenciar en nuestra investigación, se convierte en uno de los elementos narrativos más reveladores de sus relatos fílmicos. Madrid es recurrente en nuestro cine desde que las cintas silentes de Promio, uno de los emisarios de los hermanos Lumière, recogieran con precisión documental los lugares cotidianos más icónicos de la ciudad. A partir de ese momento, y a través de un juego de espejos urbano digno del mejor pintor cubista, la ciudad de Madrid ha sido representada, con más o menos fortuna, por un sinfín de directores que han intentado esclarecer en sus películas la esencia de una ciudad histórica...

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Este trabajo presenta el desarrollo de una aplicación destinada al análisis de secuencias de imágenes para la detección de movimiento en la escena. Se trata de un campo importante de la Visión Artificial, con múltiples aplicaciones entre las que se encuentra la videovigilancia con fines de seguridad, el control de tráfico, el movimiento de personas o el seguimiento y localización de objetos entre otras muchas. Para ello se utilizan métodos de análisis como son el de Lucas-Kanade y Gauss-Seidel, que obtienen el denominado flujo óptico. Este describe el movimiento que ha tenido lugar entre las imágenes y su fundamento estriba en la determinación de las variables espaciales y temporales en las imágenes, siendo precisamente la variable temporal la que introduce el concepto fundamental para el análisis del movimiento a partir de las imágenes captadas en diferentes instantes de tiempo dentro de la secuencia analizada. Para el desarrollo de la aplicación se han utilizado técnicas propias del tratamiento de la Visión Artificial, así como la metodología proporcionada por la Ingeniería del Software. Así, se ha realizado una especificación de requisitos, se ha elaborado y seguido un plan de proyecto y se ha realizado un análisis de alto nivel, que se materializa en el correspondiente diseño e implementación, junto con las pruebas de verificación y validación, obviamente adaptados en todos los casos a las dimensiones del proyecto, pero que establecen claramente los planteamientos básicos para el desarrollo de una aplicación a nivel empresarial. La aplicación planteada se enmarca perfectamente dentro del paradigma, hoy en día en pleno auge, conocido como el Internet de las Cosas (IoT). El IoT permite la intercomunicación entre dispositivos remotos, de forma que mediante la correspondiente comunicación a través de conexiones a Internet es posible obtener datos remotos para su posterior análisis, bien en nodos locales o en la nube, como concepto íntimamente relacionado con el IoT. Este es el caso de la aplicación que se presenta, de suerte que los métodos de procesamiento de las imágenes pueden aplicarse localmente o bien transmitir las mismas para su procesamiento en nodos remotos.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

El siguiente trabajo de fin de Master tiene como objetivo la realización de una traducción audiovisual al español de la serie americana de crimen Wicked City, en concreto de los dos primeros episodios de esta. El creciente desarrollo tecnológico sufrido en los últimos años así como el aumento en el número de producciones audiovisuales, ha colocado a la rama de la traducción audiovisual en una de las más demandadas hoy en día. Aun habiendo una gran cantidad de productos audiovisuales, sobre todo series y películas, que son importadas y exportadas y por lo tanto traducidas y adaptadas a la cultura receptora, siendo las más traducidas las estadounidenses, hay aun algunas que todavía no han sido objeto de este proceso. Y este es el caso de, por ejemplo, la serie elegida en este trabajo, Wicked City, que no ha sido oficialmente traducida al español. Por lo tanto, este trabajo propone una traducción para los dos primeros capítulos de esta serie, y dicha traducción es acompañada de un análisis de las prioridades y restricciones que se han seguido para llevarla a cabo, así como de una ejemplificación de las características específicas pertenecientes al género del crimen en esta serie concreta y de algunas de las técnicas de traducción usadas en el proyecto. La disertación se estructura en cinco partes aparte de la introductoria. La primera es un marco teórico sobre la traducción audiovisual y el género del crimen. En la segunda, se presenta la metodología usada para el proyecto. La tercera se centra en la traducción de la serie en sí. La cuarta es un análisis y discusión sobre la traducción. La quinta y última, está destinada a las conclusiones y sugerencias para investigación futura. En el marco teórico se define la traducción audiovisual como una traducción de cualquier producto audiovisual, ya sea de cine, televisión, teatro, radio, o de aplicaciones informáticas, siendo esta una disciplina relativamente nueva. Así mismo, también se da una vista general de todos los modos de traducción audiovisual, así como de las prioridades técnicas y lingüísticas de esta y la situación de la disciplina en el ámbito universitario español. También se comentan los aspectos más básicos del crimen ficticio así como las características de este género en las series televisivas. En la sección de metodología se explica que con el fin de llevar desarrollar el objetivo del trabajo, el primer paso a seguir fue, tras la visualización de la serie, el transcribir los diálogos de los dos episodios a un documento aparte, creando así lo que podríamos llamar el “script original”. Una vez hecho esto, se tradujeron ambos episodios al español. Seguidamente, se imprimó tal script para poder señalar todos los aspectos a discutir, es decir, las restricciones, las características del crimen de televisión y las técnicas de traducción. Finalmente, se llevó a cabo un análisis cualitativo de todos los aspectos mencionados previamente. Así bien, en la sección de análisis, se destaca que se llevó como prioridad el intentar conservar un lenguaje natural y no forzado. Para tal prioridad hay que tener en cuenta las restricciones que nos presenta la traducción: los referentes culturales, los nombres propios, la intertextualidad, las unidades fraseológicas, las rimas, los calcos, las normas ortotipográficas, los diferentes acentos y las interjecciones. Además, esta serie presenta una serie de características pertenecientes al género del crimen que son las preguntas, la terminología específica, los marcadores pragmáticos y los “suavizadores” . Por último, para llevar a cabo la traducción se siguieron diversas técnicas, así como préstamo, traducción palabra por palabra, traducción literal, omisión, reducción, particularización, generalización, transposición, amplificación, variación, substitución y adaptación. Todos estos aspectos son ejemplificados con ejemplos extraídos de la traducción. Como conclusión, se resalta que una traducción audiovisual contiene mayormente dos tipos de restricciones: las técnicas y las lingüísticas. Las primeras van a estar especialmente ligadas a la modalidad de traducción audiovisual. Aunque en este trabajo la traducción no ha sido realizada con el fin de adaptarla a una modalidad específica, y por tanto las restricciones técnicas no suponen tantos problemas, es importante tener en cuenta la coherencia visual y auditiva, que de cierta manera van a condicionar la traducción. Así, a la hora de familiarizar, extranjerizar y naturalizar un término cultural, es importante mantener dichas coherencias. Por lo tanto, va a ser más fácil usar estas técnicas con un término que no aparece en pantalla. En cuanto a las restricciones lingüísticas, nos encontramos con los referentes culturales, los nombres propios, la intertextualidad, las unidades fraseológicas, las rimas, los calcos, las normas ortotipográficas, los diferentes acentos y las interjecciones, aspectos que el traductor tiene que cuidar especialmente. Finalmente, ya que ha sido muy poca la investigación realizada en el género del crimen desde un punto de vista traductológico, algunas líneas de estudio futuras podrían ser: estudiar en mayor profundidad las características que son específicas al genero del crimen, especialmente en las series de televisión; comparar estas características con las características de otro tipo de textos como por ejemplo la novela; estudiar si estas características especificas a un género condicionan de alguna manera la traducción, y si es así, hasta qué punto; y por último, determinar cómo una traducción puede ser diferente dependiendo del género, es decir, por ejemplo, si es de tipo romántico, de crimen, o de comedia.

Relevância:

50.00% 50.00%

Publicador:

Resumo:

Estudios en niños con Trastornos en el Neurodesarrollo del Lenguaje (TNDL) han mostrado que esta población tiene mayores dificultades en el acceso al léxico que los niños con Desarrollo Típico (DT). Estas dificultades se materializan principalmente en ausencia de respuesta ante la demanda de denominación de una imagen (respuesta anómica) o la elicitación de una denominación correspondiente a otro objeto, bien por su proximidad semántica o bien por la proximidad entre sus nombres (sustituciones parafásicas semánticas y fonológicas). Sin embargo, estas características no parecen ser generalizables al conjunto de los niños TNDL y se pone en duda que lo sea aún en poblaciones más específicas en las que es una característica bastante común y remarcable como en los niños con TEL. En el presente estudio se ha diseñado y construido una prueba para estudiar el procesamiento léxico en niños con edades comprendidas entre los 2;06 y 7;11 años: el Test de Evaluación y Análisis del Léxico Infantil (ALI). La prueba incluye una tarea de denominación y dos tareas complementarias: una de reconocimiento e identificación de imágenes (comprensión léxica por vía auditiva) y otra de repetición de palabras. La prueba se aplicó a una amplia población de niños con DT del lenguaje (n=240) de las edades mencionadas con objeto de disponer de una primera referencia del comportamiento normativo de la población infantil en la tarea de denominación de imágenes. Los resultados obtenidos con la población de niños con DT ponen de manifiesto que la prueba posee un alto nivel de consistencia interna y validez convergente. Las puntuaciones obtenidas han permitido elaborar un baremo en puntuaciones centiles de la denominación e identificación de imágenes y repetición de palabras para la población comprendida entre los 3 y 6 años...

Relevância:

50.00% 50.00%

Publicador:

Resumo:

La piedra ha sobrevivido al paso del tiempo, aparece en todas las manifestaciones artísticas y culturales como un material irreemplazable en la representación tridimensional. Fue el primer aliado que tuvo el ser humano en su confrontación con el medio natural, dejando una profunda huella en nuestra memoria cultural y genética. Artistas de antes y de hoy continúan aprovechando sus propiedades físicas y simbólicas, de modo que su valor no ha llegado a disolverse del todo en la multidireccionalidad de la escultura actual y continúa siendo un material potencialmente significante. En esta investigación trataremos de desentrañar la dialéctica que tiene en el presente, cuál ha sido su evolución y qué mecanismos ratifican su validez. Analizando casos particulares y periodos generales de la historia para determinar unas constantes y unas variables. Nuestro estudio se inicia en un periodo anterior a la historia, recorriendo en el transcurso de casi 3.000 años los principales movimientos e hitos que han abonado la escultura del siglo XX y consiguientemente el devenir del siglo XXI, examinando la obra de diferentes artistas que cotidianamente se han relacionado con la piedra. Hemos estructurado el contenido en tres partes: • 1ª Parte: “Arte con fronteras” (El principio de un ciclo: un recorrido por el pasado histórico). • 2ª Parte: “Arte sin fronteras” (El final de un ciclo: la senda del presente histórico). • 3ª Parte: “Laboratorio de ideas” (Renovación y supervivencia de un clásico: revisión del panorama actual y valoración de la escultura realizada en piedra)...