33 resultados para Hierarchy of text classifiers
Resumo:
Sin duda, el rostro humano ofrece mucha más información de la que pensamos. La cara transmite sin nuestro consentimiento señales no verbales, a partir de las interacciones faciales, que dejan al descubierto nuestro estado afectivo, actividad cognitiva, personalidad y enfermedades. Estudios recientes [OFT14, TODMS15] demuestran que muchas de nuestras decisiones sociales e interpersonales derivan de un previo análisis facial de la cara que nos permite establecer si esa persona es confiable, trabajadora, inteligente, etc. Esta interpretación, propensa a errores, deriva de la capacidad innata de los seres humanas de encontrar estas señales e interpretarlas. Esta capacidad es motivo de estudio, con un especial interés en desarrollar métodos que tengan la habilidad de calcular de manera automática estas señales o atributos asociados a la cara. Así, el interés por la estimación de atributos faciales ha crecido rápidamente en los últimos años por las diversas aplicaciones en que estos métodos pueden ser utilizados: marketing dirigido, sistemas de seguridad, interacción hombre-máquina, etc. Sin embargo, éstos están lejos de ser perfectos y robustos en cualquier dominio de problemas. La principal dificultad encontrada es causada por la alta variabilidad intra-clase debida a los cambios en la condición de la imagen: cambios de iluminación, oclusiones, expresiones faciales, edad, género, etnia, etc.; encontradas frecuentemente en imágenes adquiridas en entornos no controlados. Este de trabajo de investigación estudia técnicas de análisis de imágenes para estimar atributos faciales como el género, la edad y la postura, empleando métodos lineales y explotando las dependencias estadísticas entre estos atributos. Adicionalmente, nuestra propuesta se centrará en la construcción de estimadores que tengan una fuerte relación entre rendimiento y coste computacional. Con respecto a éste último punto, estudiamos un conjunto de estrategias para la clasificación de género y las comparamos con una propuesta basada en un clasificador Bayesiano y una adecuada extracción de características. Analizamos en profundidad el motivo de porqué las técnicas lineales no han logrado resultados competitivos hasta la fecha y mostramos cómo obtener rendimientos similares a las mejores técnicas no-lineales. Se propone un segundo algoritmo para la estimación de edad, basado en un regresor K-NN y una adecuada selección de características tal como se propuso para la clasificación de género. A partir de los experimentos desarrollados, observamos que el rendimiento de los clasificadores se reduce significativamente si los ´estos han sido entrenados y probados sobre diferentes bases de datos. Hemos encontrado que una de las causas es la existencia de dependencias entre atributos faciales que no han sido consideradas en la construcción de los clasificadores. Nuestro resultados demuestran que la variabilidad intra-clase puede ser reducida cuando se consideran las dependencias estadísticas entre los atributos faciales de el género, la edad y la pose; mejorando el rendimiento de nuestros clasificadores de atributos faciales con un coste computacional pequeño. Abstract Surely the human face provides much more information than we think. The face provides without our consent nonverbal cues from facial interactions that reveal our emotional state, cognitive activity, personality and disease. Recent studies [OFT14, TODMS15] show that many of our social and interpersonal decisions derive from a previous facial analysis that allows us to establish whether that person is trustworthy, hardworking, intelligent, etc. This error-prone interpretation derives from the innate ability of human beings to find and interpret these signals. This capability is being studied, with a special interest in developing methods that have the ability to automatically calculate these signs or attributes associated with the face. Thus, the interest in the estimation of facial attributes has grown rapidly in recent years by the various applications in which these methods can be used: targeted marketing, security systems, human-computer interaction, etc. However, these are far from being perfect and robust in any domain of problems. The main difficulty encountered is caused by the high intra-class variability due to changes in the condition of the image: lighting changes, occlusions, facial expressions, age, gender, ethnicity, etc.; often found in images acquired in uncontrolled environments. This research work studies image analysis techniques to estimate facial attributes such as gender, age and pose, using linear methods, and exploiting the statistical dependencies between these attributes. In addition, our proposal will focus on the construction of classifiers that have a good balance between performance and computational cost. We studied a set of strategies for gender classification and we compare them with a proposal based on a Bayesian classifier and a suitable feature extraction based on Linear Discriminant Analysis. We study in depth why linear techniques have failed to provide competitive results to date and show how to obtain similar performances to the best non-linear techniques. A second algorithm is proposed for estimating age, which is based on a K-NN regressor and proper selection of features such as those proposed for the classification of gender. From our experiments we note that performance estimates are significantly reduced if they have been trained and tested on different databases. We have found that one of the causes is the existence of dependencies between facial features that have not been considered in the construction of classifiers. Our results demonstrate that intra-class variability can be reduced when considering the statistical dependencies between facial attributes gender, age and pose, thus improving the performance of our classifiers with a reduced computational cost.
Resumo:
La tesis que se presenta tiene como propósito la construcción automática de ontologías a partir de textos, enmarcándose en el área denominada Ontology Learning. Esta disciplina tiene como objetivo automatizar la elaboración de modelos de dominio a partir de fuentes información estructurada o no estructurada, y tuvo su origen con el comienzo del milenio, a raíz del crecimiento exponencial del volumen de información accesible en Internet. Debido a que la mayoría de información se presenta en la web en forma de texto, el aprendizaje automático de ontologías se ha centrado en el análisis de este tipo de fuente, nutriéndose a lo largo de los años de técnicas muy diversas provenientes de áreas como la Recuperación de Información, Extracción de Información, Sumarización y, en general, de áreas relacionadas con el procesamiento del lenguaje natural. La principal contribución de esta tesis consiste en que, a diferencia de la mayoría de las técnicas actuales, el método que se propone no analiza la estructura sintáctica superficial del lenguaje, sino que estudia su nivel semántico profundo. Su objetivo, por tanto, es tratar de deducir el modelo del dominio a partir de la forma con la que se articulan los significados de las oraciones en lenguaje natural. Debido a que el nivel semántico profundo es independiente de la lengua, el método permitirá operar en escenarios multilingües, en los que es necesario combinar información proveniente de textos en diferentes idiomas. Para acceder a este nivel del lenguaje, el método utiliza el modelo de las interlinguas. Estos formalismos, provenientes del área de la traducción automática, permiten representar el significado de las oraciones de forma independiente de la lengua. Se utilizará en concreto UNL (Universal Networking Language), considerado como la única interlingua de propósito general que está normalizada. La aproximación utilizada en esta tesis supone la continuación de trabajos previos realizados tanto por su autor como por el equipo de investigación del que forma parte, en los que se estudió cómo utilizar el modelo de las interlinguas en las áreas de extracción y recuperación de información multilingüe. Básicamente, el procedimiento definido en el método trata de identificar, en la representación UNL de los textos, ciertas regularidades que permiten deducir las piezas de la ontología del dominio. Debido a que UNL es un formalismo basado en redes semánticas, estas regularidades se presentan en forma de grafos, generalizándose en estructuras denominadas patrones lingüísticos. Por otra parte, UNL aún conserva ciertos mecanismos de cohesión del discurso procedentes de los lenguajes naturales, como el fenómeno de la anáfora. Con el fin de aumentar la efectividad en la comprensión de las expresiones, el método provee, como otra contribución relevante, la definición de un algoritmo para la resolución de la anáfora pronominal circunscrita al modelo de la interlingua, limitada al caso de pronombres personales de tercera persona cuando su antecedente es un nombre propio. El método propuesto se sustenta en la definición de un marco formal, que ha debido elaborarse adaptando ciertas definiciones provenientes de la teoría de grafos e incorporando otras nuevas, con el objetivo de ubicar las nociones de expresión UNL, patrón lingüístico y las operaciones de encaje de patrones, que son la base de los procesos del método. Tanto el marco formal como todos los procesos que define el método se han implementado con el fin de realizar la experimentación, aplicándose sobre un artículo de la colección EOLSS “Encyclopedia of Life Support Systems” de la UNESCO. ABSTRACT The purpose of this thesis is the automatic construction of ontologies from texts. This thesis is set within the area of Ontology Learning. This discipline aims to automatize domain models from structured or unstructured information sources, and had its origin with the beginning of the millennium, as a result of the exponential growth in the volume of information accessible on the Internet. Since most information is presented on the web in the form of text, the automatic ontology learning is focused on the analysis of this type of source, nourished over the years by very different techniques from areas such as Information Retrieval, Information Extraction, Summarization and, in general, by areas related to natural language processing. The main contribution of this thesis consists of, in contrast with the majority of current techniques, the fact that the method proposed does not analyze the syntactic surface structure of the language, but explores his deep semantic level. Its objective, therefore, is trying to infer the domain model from the way the meanings of the sentences are articulated in natural language. Since the deep semantic level does not depend on the language, the method will allow to operate in multilingual scenarios, where it is necessary to combine information from texts in different languages. To access to this level of the language, the method uses the interlingua model. These formalisms, coming from the area of machine translation, allow to represent the meaning of the sentences independently of the language. In this particular case, UNL (Universal Networking Language) will be used, which considered to be the only interlingua of general purpose that is standardized. The approach used in this thesis corresponds to the continuation of previous works carried out both by the author of this thesis and by the research group of which he is part, in which it is studied how to use the interlingua model in the areas of multilingual information extraction and retrieval. Basically, the procedure defined in the method tries to identify certain regularities at the UNL representation of texts that allow the deduction of the parts of the ontology of the domain. Since UNL is a formalism based on semantic networks, these regularities are presented in the form of graphs, generalizing in structures called linguistic patterns. On the other hand, UNL still preserves certain mechanisms of discourse cohesion from natural languages, such as the phenomenon of the anaphora. In order to increase the effectiveness in the understanding of expressions, the method provides, as another significant contribution, the definition of an algorithm for the resolution of pronominal anaphora limited to the model of the interlingua, in the case of third person personal pronouns when its antecedent is a proper noun. The proposed method is based on the definition of a formal framework, adapting some definitions from Graph Theory and incorporating new ones, in order to locate the notions of UNL expression and linguistic pattern, as well as the operations of pattern matching, which are the basis of the method processes. Both the formal framework and all the processes that define the method have been implemented in order to carry out the experimentation, applying on an article of the "Encyclopedia of Life Support Systems" of the UNESCO-EOLSS collection.
Resumo:
Arquifanía: arquitectura y epifanía. La revelación que se da en el proyectar, en el construir y en el habitar. Desentrañar los protagonistas y el escenario de ese encuentro es el objetivo de esta tesis. Nace de una doble inquietud: la relación entre literatura y arquitectura y la constatación de algo inconmensurable en la arquitectura. A lo largo de los siglos la teoría de la arquitectura ha hecho un gran esfuerzo por racionalizar todos los aspectos de la disciplina. La sistematización del orden y jerarquía de los espacios, el uso de parámetros más rigurosos en los cálculos estructurales, el desarrollo de la técnica y el estudio de los esquemas funcionales han supuesto una fuente inagotable de manifestaciones arquitectónicas. Los paradigmas científicos, incluso, han resultado fundamentales en la creación de nuevos lenguajes. Sin embargo, en este camino de racionalización se han orillado aspectos de difícil cuantificación. Pese a que en la experiencia diaria del arquitecto se constata la presencia de parámetros inconmensurables, la teoría de la arquitectura no ha integrado de forma sistemática este conocimiento. De aquí nace la presente tesis doctoral. En ella se estudia, por analogía con el resto de artes, el concepto de manifestación. Se analiza de qué manera la obra arquitectónica se manifiesta, haciendo uso de su autonomía, y se convierte en la que dirige al arquitecto en todos los tiempos de la existencia de la obra: desde su génesis en el tiempo del proyecto hasta la experiencia de la obra terminada en el tiempo de la historia. Se considera que reflexionar en el concepto de manifestación puede aportar luces sobre la disciplina arquitectónica en un doble momento. Se estudia por una parte la actitud y el proceder del arquitecto ante la génesis del proyecto y por otra su posicionamiento ante la obra ya existente, sometida a su análisis (para la posterior síntesis) generando una espiral de conocimiento siempre abierta y en continuo enriquecimiento. Se analiza la obra de María Zambrano, filósofa, y José Ángel Valente, poeta, en busca de la definición del concepto de manifestación. El momento creativo, la naturaleza de la palabra poética, la actitud del poeta ante su obra, el conocimiento y la revelación de la belleza son temas recurrentes en sus obras y crean un corpus teórico que permite elaborar una teoría poética sólida y abierta, llena de sugerencias que se dirige con precisión al momento de la generación de la forma: su epifanía. A continuación se repasa el concepto de manifestación en la actividad de algunos artistas de la modernidad que, de manera implícita o explícita, han hablado del concepto de epifanía. A menudo de forma intuitiva, los artistas han detectado en su actividad la condición de ser depositarios de un don que se renueva en cada obra ejecutada. Entrelazado con su trabajo y con la disciplina diaria los artistas experimentan un diálogo con la obra, que se revela libre y con voluntad de manifestarse. Enunciado el problema y hecho el repaso por el mundo de la creación artística, nos enfrentamos con el núcleo de la tesis: ¿hasta qué punto y de qué manera el concepto de manifestación es válido en arquitectura? El discurso busca en la actividad de múltiples arquitectos la validez del concepto de manifestación. Se rastrean testimonios, textos, obras y análisis de obras. De esta investigación surge una topografía, un atlas de revelaciones de manifestaciones arquitectónicas: constataciones explícitas, testimonios implícitos o intuiciones. A través de este periplo entre el concepto de manifestación que la razón poética ofrece y la experiencia de muchos arquitectos se intenta responder, aunque sea parcialmente, a las preguntas que surgen al llevar a las últimas consecuencias la arquifanía: ¿En qué momento existe una voluntad de forma? ¿De qué manera encuentra el arquitecto la forma? ¿Cómo se le presenta? ¿Es el arquitecto el verdadero artífice de la obra? ¿O es en cambio un ser a la espera de la aparición? ABSTRACT Archiphany: architecture and epiphany. The revelation taking place in designing, building and living. The objective of the present dissertation is to unravel the protagonists and the scenario of this encounter. It stems from a double interest: the relationship between literature and architecture and the discovery of something incommensurable in architecture. Over the centuries, architectural theory has made a great effort in order to rationalise all aspects of this discipline. Thus, the systematization of the order and hierarchy of space, the use of more rigorous parameters on the structural analysis, the development of technical capacities and the study of functional schemes have been an inexhaustible source of architectural manifestations. Even scientific paradigms have been essential in the creation of new languages. However, aspects of difficult quantification have been relegated in this path of rationalisation. Whereas the presence of immeasurable parameters are encountered in the daily experience of the architect, architectural theory has failed to systematically integrate this knowledge. This is the driving force of this thesis. It explores, by analogy with the other arts, the concept of manifestation. It discusses how the architectural work manifests itself, making use of its autonomy, becoming the one leading the architect during the whole existence of the work: from its genesis in the designing time until the experience of the completed work in the historical time. In the present dissertation, it is assumed that reflecting on the concept of manifestation might shed light on two different moments on the way to project architecture. The architect approach to the project genesis is studied on the one hand, while in the other hand it is considered his positioning in front of the existing work, as well as his analysis (for a following synthesis) that generates an ever-open and ever-enriching spiral of knowledge. In the search for a definition of the concept of manifestation, the work of the philosopher María Zambrano and the poet José Ángel Valente are analysed. The creative moment, the nature of the poetic word, the attitude of the poet in front of his work, the knowledge and the revelation of beauty are persistent issues in their works. They create a theoretical corpus allowing to develop a sound and open poetical theory full of suggestions, accurately directed to the time of the form generation: its epiphany. The concept of manifestation is then reviewed in the activity of some modern artists that talked about the concept of epiphany –either implicitly or explicitly. Often in an intuitive way, artists have come to realize in their activity to be the depositories of a gift that is renewed in each work. Intertwined with their work and with their daily discipline, artists experience a dialogue with the work, which proves to be free and willing to manifest itself. Having stated the problem and having reviewed the world of artistic creation, we are confronted with the core of the thesis: Up to which extent and in which way is the concept of manifestation valid for architecture? Validity and evidence of this concept is sought in the activity of multiple architects. Texts, works, analysis, reviews and testimonies are investigated. From this research, a topography, an atlas of revelations of architectural manifestations arises: explicit findings, implicit witnesses or intuitions. By means of this journey going from the concept of manifestation hinted by the poetic reason to the experience of many architects, the ultimate questions risen by archiphany are meant to be answered (though partially): When does a will of form emerge? How does the architect find the form? How does it appear? Is the architect the true creator of the work? Or is he instead a being waiting for the vision?