918 resultados para procesamiento del lenguaje natural
Resumo:
Se presenta un estudio y propuesta de interoperabilidad semántica entre ontologías del dominio de la salud basada en técnicas de procesamiento del lenguaje natural. El objetivo fundamental ha sido el desarrollo de un algoritmo de interconexión semántica entre los términos de dos ontologías solapadas y heterogéneas, denominadas «fuente» (Clasificación internacional de enfermedades, 9ª revisión, modificación clínica: CIE-9-MC) y «diana» (esquema jerárquico de la asignatura Enfermería Materno-Infantil: EMI). Esta propuesta permite emparejar semánticamente ontologías, a partir de la reutilización de otro recurso ontológico (WordNet español), sin destruir o modificar la semántica de identidad de cada una de las ontologías involucradas. El modelo presentado puede permitir al usuario acceder a la información que necesita en otra clasificación jerárquica, sin precisar de un entrenamiento referido a la conceptualización de cada sistema, pues utilizaría la ontología «diana» con la que está familiarizado para su aplicación a la recuperación de información.
Resumo:
Este artículo presenta la aplicación y resultados obtenidos de la investigación en técnicas de procesamiento de lenguaje natural y tecnología semántica en Brand Rain y Anpro21. Se exponen todos los proyectos relacionados con las temáticas antes mencionadas y se presenta la aplicación y ventajas de la transferencia de la investigación y nuevas tecnologías desarrolladas a la herramienta de monitorización y cálculo de reputación Brand Rain.
Resumo:
La rápida evolución experimentada en los últimos años por las tecnologías de Internet ha estimulado la proliferación de recursos software en varias disciplinas científicas, especialmente en bioinformática. En la mayoría de los casos, la tendencia actual es publicar dichos recursos como servicios accesibles libremente a través de Internet, utilizando tecnologías y patrones de diseño definidos para la implementación de Arquitecturas Orientadas a Servicios (SOA). La combinación simultánea de múltiples servicios dentro de un mismo flujo de trabajo abre la posibilidad de crear aplicaciones potencialmente más útiles y complejas. La integración de dichos servicios plantea grandes desafíos, tanto desde un punto de vista teórico como práctico, como por ejemplo, la localización y acceso a los recursos disponibles o la coordinación entre ellos. En esta tesis doctoral se aborda el problema de la identificación, localización, clasificación y acceso a los recursos informáticos disponibles en Internet. Con este fin, se ha definido un modelo genérico para la construcción de índices de recursos software con información extraída automáticamente de artículos de la literatura científica especializada en un área. Este modelo consta de seis fases que abarcan desde la selección de las fuentes de datos hasta el acceso a los índices creados, pasando por la identificación, extracción, clasificación y “curación” de la información relativa a los recursos. Para verificar la viabilidad, idoneidad y eficiencia del modelo propuesto, éste ha sido evaluado en dos dominios científicos diferentes—la BioInformática y la Informática Médica—dando lugar a dos índices de recursos denominados BioInformatics Resource Inventory (BIRI) y electronic-Medical Informatics Repository of Resources(e-MIR2) respectivamente. Los resultados obtenidos de estas aplicaciones son presentados a lo largo de la presente tesis doctoral y han dado lugar a varias publicaciones científicas en diferentes revistas JCR y congresos internacionales. El impacto potencial y la utilidad de esta tesis doctoral podrían resultar muy importantes teniendo en cuenta que, gracias a la generalidad del modelo propuesto, éste podría ser aplicado en cualquier disciplina científica. Algunas de las líneas de investigación futuras más relevantes derivadas de este trabajo son esbozadas al final en el último capítulo de este libro. ABSTRACT The rapid evolution experimented in the last years by the Internet technologies has stimulated the proliferation of heterogeneous software resources in most scientific disciplines, especially in the bioinformatics area. In most cases, current trends aim to publish those resources as services freely available over the Internet, using technologies and design patterns defined for the implementation of Service-Oriented Architectures (SOA). Simultaneous combination of various services into the same workflow opens the opportunity of creating more complex and useful applications. Integration of services raises great challenges, both from a theoretical to a practical point of view such as, for instance, the location and access to the available resources or the orchestration among them. This PhD thesis deals with the problem of identification, location, classification and access to informatics resources available over the Internet. On this regard, a general model has been defined for building indexes of software resources, with information extracted automatically from scientific articles from the literature specialized in the area. Such model consists of six phases ranging from the selection of data sources to the access to the indexes created, covering the identification, extraction, classification and curation of the information related to the software resources. To verify the viability, feasibility and efficiency of the proposed model, it has been evaluated in two different scientific domains—Bioinformatics and Medical Informatics—producing two resources indexes named BioInformatics Resources Inventory (BIRI) and electronic-Medical Informatics Repository of Resources (e-MIR2) respectively. The results and evaluation of those systems are presented along this PhD thesis, and they have produced different scientific publications in several JCR journals and international conferences. The potential impact and utility of this PhD thesis could be of great relevance considering that, thanks to the generality of the proposed model, it could be successfully extended to any scientific discipline. Some of the most relevant future research lines derived from this work are outlined at the end of this book.
Resumo:
El campo de procesamiento de lenguaje natural (PLN), ha tenido un gran crecimiento en los últimos años; sus áreas de investigación incluyen: recuperación y extracción de información, minería de datos, traducción automática, sistemas de búsquedas de respuestas, generación de resúmenes automáticos, análisis de sentimientos, entre otras. En este artículo se presentan conceptos y algunas herramientas con el fin de contribuir al entendimiento del procesamiento de texto con técnicas de PLN, con el propósito de extraer información relevante que pueda ser usada en un gran rango de aplicaciones. Se pueden desarrollar clasificadores automáticos que permitan categorizar documentos y recomendar etiquetas; estos clasificadores deben ser independientes de la plataforma, fácilmente personalizables para poder ser integrados en diferentes proyectos y que sean capaces de aprender a partir de ejemplos. En el presente artículo se introducen estos algoritmos de clasificación, se analizan algunas herramientas de código abierto disponibles actualmente para llevar a cabo estas tareas y se comparan diversas implementaciones utilizando la métrica F en la evaluación de los clasificadores.
Resumo:
En esta comunicación presentamos parte de los resultados obtenidos en las investigaciones realizadas dentro de Planes Nacionales de Investigación Educativa del C.I.D.E. durante los cursos 1987-88 y 1988-89, que trataban de averiguar las dificultades del aprendizaje del álgebra en secundaria. El objetivo inicial de este trabajo era estudiar las dificultades planteadas en la resolución de problemas de enunciado verbal en los que se utiliza una ecuación de primer grado o un sistema lineal de dos ecuaciones con dos incógnitas, ya que considerabamos, como la mayoría de los profesores lo hace, que la mayor dificultad presentada en álgebra estaba en la resolución de estos problemas.
Resumo:
El objetivo general de este proyecto se centra en el estudio, desarrollo y experimentación de diferentes técnicas y sistemas basados en Tecnologías del Lenguaje Humano (TLH) para el desarrollo de la próxima generación de sistemas de procesamiento inteligente de la información digital (modelado, recuperación, tratamiento, comprensión y descubrimiento) afrontando los actuales retos de la comunicación digital. En este nuevo escenario, los sistemas deben incorporar capacidades de razonamiento que descubrirán la subjetividad de la información en todos sus contextos (espacial, temporal y emocional) analizando las diferentes dimensiones de uso (multilingualidad, multimodalidad y registro).
Resumo:
El objetivo de este proyecto se basa en la necesidad de replantearse la filosofía clásica del TLH para adecuarse tanto a las fuentes disponibles actualmente (datos no estructurados con multi-modalidad, multi-lingualidad y diferentes grados de formalidad) como a las necesidades reales de los usuarios finales. Para conseguir este objetivo es necesario integrar tanto la comprensión como la generación del lenguaje humano en un modelo único (modelo LEGOLANG) basado en técnicas de deconstrucción de la lengua, independiente de su aplicación final y de la variante de lenguaje humano elegida para expresar el conocimiento.
Resumo:
Acercarnos al tema de la lectura desde la perspectiva de la Neuropsicología, intentando realizar una contribución integradora del proceso lector, de las dificultades de su aprendizaje y de su tratamiento. . Primera fase: la muestra inicial estaba constituída por 200 sujetos, 131 varones y 69 mujeres, con un rango de edad de 9-12 años. En un segundo momento, medimos la Preferencia Manual en un grupo de sujetos quienes utilizan la mano izquierda para escribir. Esta muestra estuvo formada por 64 sujetos. Segunda fase: utilizamos los 264 alumnos, clasificados en la fase anterior, según su preferencia manual. . Primera fase: 'preferencia manual': esta fase tiene como objetivo el estudio de la preferencia manual en una amplia muestra de sujetos en edad escolar. Las variables controladas fueron: edad y normalidad neurológica, inteligencia, atención, centro escolar de procedencia, problemas emocionales, absentismo escolar, desconocimiento de los objetivos y entrenamiento previo, local. Segunda fase, 'lateralización cerebral del lenguaje': estudiamos la asimetría cerebral para el procesamiento del lenguaje de los sujetos analizados. Utilizamos la técnica de tareas concurrentes (TC) que consiste en contrastar la ejecución de un sujeto cuando realiza dos tareas simultáneamente (tarea primaria más tarea secundaria). Se plantearon seis condiciones experimentales: tapping con la mano dercha (SD); tapping con la mano izquierda (SI); tarea verbal (SV); tarea espacial (SE); tapping con la mano izquierda y tarea verbal (CIV); tapping con la mano derecha y tarea verbal (CDV); tapping con la mano izquierda y tarea espacial (CIE) y tapping con la mano derecha y tarea espacial (CDE). Tercera fase: en esta fase pretendemos poner en relación la preferencia manual y la lateralización cerebral del lenguaje con el rendimiento lector. Utilizamos un diseño factorial 2X2X2 con las variables lateralización del lenguaje, preferencia manual y la variable sexo. Las variables dependientes fueron: tiempo de lectura, errores de la lectura, comprensión, índice de eficiencia en lectura y escritura. . Primera fase: test de Dominancia Lateral (Harris, 1947) que dispone de las siguientes categorías: para la preferencia manual: 1. mano preferida; 2. Escritura simultánea; 3. Escritura; 4. Punteado; 5. Repartir cartas. Para la dominancia del pie: 1. Dar una patada; 2. Golpear con el pie. Para la dominancia ocular: 1. Test Monoculares; Test binoculares. También se usó el test de Inteligencia Lorge-Thorndike (1954) y la escala de Inteligencia de Wechler para niños (Wechler, 1954). Segunda fase; estímulos, ordenador, cronómetro. La tarea primaria era una tarea motora de 'tapping', mientras que las tareas secundarias eran de tipo verbal o espacial. . Primera fase: encontramos que la distribución de la preferencia manual de nuestra muestra (N=200) fue de un 76,5 por ciento de diestros, un 15,5 por ciento de zurdos y un 8 por ciento de sujetos con preferencia manual mixta. Segunda fase: Nuestros resultados muestran que tanto la tarea motora como la verbal experimentan un decremento cuando se realizan de forma simultánea. Además este decremento es asimétrico, en el sentido de una mayor interferencia entre la ejecución motora de la mano derecha y la ejecución verbal, frente a un menor decremento entre la ejecución motora izquierda y la tarea verbal. Tercera fase: Queda demostrado, en primer lugar, que es el efecto de la interacción entre la lateralización cerebral del lenguaje y la preferencia manual el que explica la relación entre asimetría cerebral y rendimiento lector, y no el efecto aislado de cada uno de estos factores. En segundo lugar, el rendimiento de los sujetos en los que confluyen los centros de control del lenguaje y mano preferida es equivalente, independientemente del hemisferio donde se produzca esta confluencia. En tercer lugar, ha quedado demostrado que los sujetos que presentan la confluencia hemisférica descrita tienen un rendimiento lector superior a aquéllos que no la presentan. En cuarto lugar, varones y mujeres, siempre que presenten un mismo tipo de organización asimétrica para estos factores, no diferencian en su rendimiento lector. . Futuras investigaciones deben establecer el peso de la confluencia hemisférica en determinar diferencias en capacidad lectora y en la aparición de los problemas de lectura. Del mismo modo, deben establecer si unos efectos alcanzan otras esferas del lenguaje..
Resumo:
Pretende demostrar que es posible estudiar el sistema fraseológico completo del inglés y el español por separado y establecer una clasificación común que deje al descubierto la gran similitud entre ambos sistemas. Se divide en seis capítulos. Los dos primeros perfilan los límites de la fraseología; los tres siguientes se dedican a la subdivisión y análisis lingüístico de las unidades de los sistemas fraseológicos del inglés y del español; el último capítulo trata del funcionamiento real de tales unidades en términos pragmáticos. Es posible establecer los mismos tipos de unidades, divididos en tres esferas (colocaciones, locuciones y enunciados fraseológicos), los cuales muestran enormes semejanzas formales, semánticas y pragmáticas, detectándose incluso universales fraseológicos. Concluye proponiendo una base de datos léxico-fraseológica que puede ser de utilidad para la lexicografía, la enseñanza de idiomas o los sistemas de procesamiento del lenguaje natural.
Resumo:
Resumen basado en el de la publicación. Es continuación del artículo 'La evaluación del lenguaje del maestro de Audición y Lenguaje I' en: Pulso: Alcalá de Henares (Madrid), 2004, n. 27, p. 71-93