851 resultados para Semi-distance learning


Relevância:

30.00% 30.00%

Publicador:

Resumo:

Neuronal morphology is a key feature in the study of brain circuits, as it is highly related to information processing and functional identification. Neuronal morphology affects the process of integration of inputs from other neurons and determines the neurons which receive the output of the neurons. Different parts of the neurons can operate semi-independently according to the spatial location of the synaptic connections. As a result, there is considerable interest in the analysis of the microanatomy of nervous cells since it constitutes an excellent tool for better understanding cortical function. However, the morphologies, molecular features and electrophysiological properties of neuronal cells are extremely variable. Except for some special cases, this variability makes it hard to find a set of features that unambiguously define a neuronal type. In addition, there are distinct types of neurons in particular regions of the brain. This morphological variability makes the analysis and modeling of neuronal morphology a challenge. Uncertainty is a key feature in many complex real-world problems. Probability theory provides a framework for modeling and reasoning with uncertainty. Probabilistic graphical models combine statistical theory and graph theory to provide a tool for managing domains with uncertainty. In particular, we focus on Bayesian networks, the most commonly used probabilistic graphical model. In this dissertation, we design new methods for learning Bayesian networks and apply them to the problem of modeling and analyzing morphological data from neurons. The morphology of a neuron can be quantified using a number of measurements, e.g., the length of the dendrites and the axon, the number of bifurcations, the direction of the dendrites and the axon, etc. These measurements can be modeled as discrete or continuous data. The continuous data can be linear (e.g., the length or the width of a dendrite) or directional (e.g., the direction of the axon). These data may follow complex probability distributions and may not fit any known parametric distribution. Modeling this kind of problems using hybrid Bayesian networks with discrete, linear and directional variables poses a number of challenges regarding learning from data, inference, etc. In this dissertation, we propose a method for modeling and simulating basal dendritic trees from pyramidal neurons using Bayesian networks to capture the interactions between the variables in the problem domain. A complete set of variables is measured from the dendrites, and a learning algorithm is applied to find the structure and estimate the parameters of the probability distributions included in the Bayesian networks. Then, a simulation algorithm is used to build the virtual dendrites by sampling values from the Bayesian networks, and a thorough evaluation is performed to show the model’s ability to generate realistic dendrites. In this first approach, the variables are discretized so that discrete Bayesian networks can be learned and simulated. Then, we address the problem of learning hybrid Bayesian networks with different kinds of variables. Mixtures of polynomials have been proposed as a way of representing probability densities in hybrid Bayesian networks. We present a method for learning mixtures of polynomials approximations of one-dimensional, multidimensional and conditional probability densities from data. The method is based on basis spline interpolation, where a density is approximated as a linear combination of basis splines. The proposed algorithms are evaluated using artificial datasets. We also use the proposed methods as a non-parametric density estimation technique in Bayesian network classifiers. Next, we address the problem of including directional data in Bayesian networks. These data have some special properties that rule out the use of classical statistics. Therefore, different distributions and statistics, such as the univariate von Mises and the multivariate von Mises–Fisher distributions, should be used to deal with this kind of information. In particular, we extend the naive Bayes classifier to the case where the conditional probability distributions of the predictive variables given the class follow either of these distributions. We consider the simple scenario, where only directional predictive variables are used, and the hybrid case, where discrete, Gaussian and directional distributions are mixed. The classifier decision functions and their decision surfaces are studied at length. Artificial examples are used to illustrate the behavior of the classifiers. The proposed classifiers are empirically evaluated over real datasets. We also study the problem of interneuron classification. An extensive group of experts is asked to classify a set of neurons according to their most prominent anatomical features. A web application is developed to retrieve the experts’ classifications. We compute agreement measures to analyze the consensus between the experts when classifying the neurons. Using Bayesian networks and clustering algorithms on the resulting data, we investigate the suitability of the anatomical terms and neuron types commonly used in the literature. Additionally, we apply supervised learning approaches to automatically classify interneurons using the values of their morphological measurements. Then, a methodology for building a model which captures the opinions of all the experts is presented. First, one Bayesian network is learned for each expert, and we propose an algorithm for clustering Bayesian networks corresponding to experts with similar behaviors. Then, a Bayesian network which represents the opinions of each group of experts is induced. Finally, a consensus Bayesian multinet which models the opinions of the whole group of experts is built. A thorough analysis of the consensus model identifies different behaviors between the experts when classifying the interneurons in the experiment. A set of characterizing morphological traits for the neuronal types can be defined by performing inference in the Bayesian multinet. These findings are used to validate the model and to gain some insights into neuron morphology. Finally, we study a classification problem where the true class label of the training instances is not known. Instead, a set of class labels is available for each instance. This is inspired by the neuron classification problem, where a group of experts is asked to individually provide a class label for each instance. We propose a novel approach for learning Bayesian networks using count vectors which represent the number of experts who selected each class label for each instance. These Bayesian networks are evaluated using artificial datasets from supervised learning problems. Resumen La morfología neuronal es una característica clave en el estudio de los circuitos cerebrales, ya que está altamente relacionada con el procesado de información y con los roles funcionales. La morfología neuronal afecta al proceso de integración de las señales de entrada y determina las neuronas que reciben las salidas de otras neuronas. Las diferentes partes de la neurona pueden operar de forma semi-independiente de acuerdo a la localización espacial de las conexiones sinápticas. Por tanto, existe un interés considerable en el análisis de la microanatomía de las células nerviosas, ya que constituye una excelente herramienta para comprender mejor el funcionamiento de la corteza cerebral. Sin embargo, las propiedades morfológicas, moleculares y electrofisiológicas de las células neuronales son extremadamente variables. Excepto en algunos casos especiales, esta variabilidad morfológica dificulta la definición de un conjunto de características que distingan claramente un tipo neuronal. Además, existen diferentes tipos de neuronas en regiones particulares del cerebro. La variabilidad neuronal hace que el análisis y el modelado de la morfología neuronal sean un importante reto científico. La incertidumbre es una propiedad clave en muchos problemas reales. La teoría de la probabilidad proporciona un marco para modelar y razonar bajo incertidumbre. Los modelos gráficos probabilísticos combinan la teoría estadística y la teoría de grafos con el objetivo de proporcionar una herramienta con la que trabajar bajo incertidumbre. En particular, nos centraremos en las redes bayesianas, el modelo más utilizado dentro de los modelos gráficos probabilísticos. En esta tesis hemos diseñado nuevos métodos para aprender redes bayesianas, inspirados por y aplicados al problema del modelado y análisis de datos morfológicos de neuronas. La morfología de una neurona puede ser cuantificada usando una serie de medidas, por ejemplo, la longitud de las dendritas y el axón, el número de bifurcaciones, la dirección de las dendritas y el axón, etc. Estas medidas pueden ser modeladas como datos continuos o discretos. A su vez, los datos continuos pueden ser lineales (por ejemplo, la longitud o la anchura de una dendrita) o direccionales (por ejemplo, la dirección del axón). Estos datos pueden llegar a seguir distribuciones de probabilidad muy complejas y pueden no ajustarse a ninguna distribución paramétrica conocida. El modelado de este tipo de problemas con redes bayesianas híbridas incluyendo variables discretas, lineales y direccionales presenta una serie de retos en relación al aprendizaje a partir de datos, la inferencia, etc. En esta tesis se propone un método para modelar y simular árboles dendríticos basales de neuronas piramidales usando redes bayesianas para capturar las interacciones entre las variables del problema. Para ello, se mide un amplio conjunto de variables de las dendritas y se aplica un algoritmo de aprendizaje con el que se aprende la estructura y se estiman los parámetros de las distribuciones de probabilidad que constituyen las redes bayesianas. Después, se usa un algoritmo de simulación para construir dendritas virtuales mediante el muestreo de valores de las redes bayesianas. Finalmente, se lleva a cabo una profunda evaluaci ón para verificar la capacidad del modelo a la hora de generar dendritas realistas. En esta primera aproximación, las variables fueron discretizadas para poder aprender y muestrear las redes bayesianas. A continuación, se aborda el problema del aprendizaje de redes bayesianas con diferentes tipos de variables. Las mixturas de polinomios constituyen un método para representar densidades de probabilidad en redes bayesianas híbridas. Presentamos un método para aprender aproximaciones de densidades unidimensionales, multidimensionales y condicionales a partir de datos utilizando mixturas de polinomios. El método se basa en interpolación con splines, que aproxima una densidad como una combinación lineal de splines. Los algoritmos propuestos se evalúan utilizando bases de datos artificiales. Además, las mixturas de polinomios son utilizadas como un método no paramétrico de estimación de densidades para clasificadores basados en redes bayesianas. Después, se estudia el problema de incluir información direccional en redes bayesianas. Este tipo de datos presenta una serie de características especiales que impiden el uso de las técnicas estadísticas clásicas. Por ello, para manejar este tipo de información se deben usar estadísticos y distribuciones de probabilidad específicos, como la distribución univariante von Mises y la distribución multivariante von Mises–Fisher. En concreto, en esta tesis extendemos el clasificador naive Bayes al caso en el que las distribuciones de probabilidad condicionada de las variables predictoras dada la clase siguen alguna de estas distribuciones. Se estudia el caso base, en el que sólo se utilizan variables direccionales, y el caso híbrido, en el que variables discretas, lineales y direccionales aparecen mezcladas. También se estudian los clasificadores desde un punto de vista teórico, derivando sus funciones de decisión y las superficies de decisión asociadas. El comportamiento de los clasificadores se ilustra utilizando bases de datos artificiales. Además, los clasificadores son evaluados empíricamente utilizando bases de datos reales. También se estudia el problema de la clasificación de interneuronas. Desarrollamos una aplicación web que permite a un grupo de expertos clasificar un conjunto de neuronas de acuerdo a sus características morfológicas más destacadas. Se utilizan medidas de concordancia para analizar el consenso entre los expertos a la hora de clasificar las neuronas. Se investiga la idoneidad de los términos anatómicos y de los tipos neuronales utilizados frecuentemente en la literatura a través del análisis de redes bayesianas y la aplicación de algoritmos de clustering. Además, se aplican técnicas de aprendizaje supervisado con el objetivo de clasificar de forma automática las interneuronas a partir de sus valores morfológicos. A continuación, se presenta una metodología para construir un modelo que captura las opiniones de todos los expertos. Primero, se genera una red bayesiana para cada experto y se propone un algoritmo para agrupar las redes bayesianas que se corresponden con expertos con comportamientos similares. Después, se induce una red bayesiana que modela la opinión de cada grupo de expertos. Por último, se construye una multired bayesiana que modela las opiniones del conjunto completo de expertos. El análisis del modelo consensuado permite identificar diferentes comportamientos entre los expertos a la hora de clasificar las neuronas. Además, permite extraer un conjunto de características morfológicas relevantes para cada uno de los tipos neuronales mediante inferencia con la multired bayesiana. Estos descubrimientos se utilizan para validar el modelo y constituyen información relevante acerca de la morfología neuronal. Por último, se estudia un problema de clasificación en el que la etiqueta de clase de los datos de entrenamiento es incierta. En cambio, disponemos de un conjunto de etiquetas para cada instancia. Este problema está inspirado en el problema de la clasificación de neuronas, en el que un grupo de expertos proporciona una etiqueta de clase para cada instancia de manera individual. Se propone un método para aprender redes bayesianas utilizando vectores de cuentas, que representan el número de expertos que seleccionan cada etiqueta de clase para cada instancia. Estas redes bayesianas se evalúan utilizando bases de datos artificiales de problemas de aprendizaje supervisado.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

One of the most important changes taking place in drylands worldwide is the increase of the cover and dominance of shrubs in areas formerly devoid of them (shrub encroachment). A large body of research has evaluated the causes and consequences of shrub encroachment for both ecosystem structure and functioning. However, there are virtually no studies evaluating how shrub encroachment affects the ability of ecosystems to maintain multiple functions and services simultaneously (multifunctionality). We aimed to do so by gathering data from ten ecosystem functions linked to the maintenance of primary production and nutrient cycling and storage (organic C, activity of β-glucosidase, pentoses, hexoses, total N, total available N, amino acids, proteins, available inorganic P, and phosphatase activity), and summarizing them in a multifunctionality index (M). We assessed how climate, species richness, anthropic factors (distance to the nearest town, sandy and asphalted road, and human population in the nearest town at several historical periods) and encroachment by sprouting shrubs impacted both the functions in isolation and M along a regional (ca. 350 km) gradient in Mediterranean grasslands and shrublands dominated by a non-sprouting shrub. Values of M were higher in those grasslands and shrublands containing sprouting shrubs (43 and 62%, respectively). A similar response was found when analyzing the different functions in isolation, as encroachment by sprouting shrubs increased functions by 2–80% compared to unencroached areas. Encroachment was the main driver of changes in M along the regional gradient evaluated, followed by anthropic factors and species richness. Climate had little effects on M in comparison to the other factors studied. Similar responses were observed when evaluating the functions in isolation. Overall, our results showed that M was higher at sites with higher sprouting shrub cover, longer distance to roads and higher perennial plant species richness. Our study is the first documenting that ecosystem multifunctionality in shrublands is enhanced by encroaching shrubs differing in size and leaf attributes. Our findings reinforce the idea that encroachment effects on ecosystem functioning cannot be generalized, and that are largely dependent on the traits of the encroaching shrub relative to those of the species being replaced.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

The study of the temperature gradients in cold stores and containers is a critical issue in the food industry for the quality assurance of products during transport and for minimising losses. This work presents an analysis of the temperatures during the refrigerated transport of 4,320 kg of blueberries in a reefer (set point temperature at ?1ºC) on a container ship from Montevideo (Uruguay) to Verona (Italy). The monitoring was performed by using semi-passive RFID loggers (TurboTag cards). The objective was to carry out a multi-distributed supervision using low-cost, wireless and autonomous sensors for the characterisation of the distribution and spatial gradients of temperatures during a long distance transport. Data analysis shows spatial (phase space) and temporal sequencing diagrams and reveals a significant heterogeneity of temperature at different locations in the container, which highlights the ineffectiveness of a temperature control system based on a single sensor, as is usually done.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

As people have more difficulty taking time away from work to attend conferences and workshops, the idea of offering courses via the Web has become more desirable. Addressing a need voiced by Medical Library Association membership, the authors developed a Web-based continuing-education course on the subject of the librarian's role in evidence-based medicine. The aim of the course was to provide medical librarians with a well-constructed, content-rich learning experience available to them at their convenience via the Web. This paper includes a discussion of the considerations that need to be taken into account when developing Web-based courses, the issues that arise when the information delivery changes from face-to-face to online, the changing role of the instructor, and the pros and cons of offering Web-based versus traditional courses. The results of the beta test and future plans for the course are also discussed.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

We investigated how human subjects adapt to forces perturbing the motion of their ams. We found that this kind of learning is based on the capacity of the central nervous system (CNS) to predict and therefore to cancel externally applied perturbing forces. Our experimental results indicate: (i) that the ability of the CNS to compensate for the perturbing forces is restricted to those spatial locations where the perturbations have been experienced by the moving arm. The subjects also are able to compensate for forces experienced at neighboring workspace locations. However, adaptation decays smoothly and quickly with distance from the locations where disturbances had been sensed by the moving limb. (ii) Our experiments also how that the CNS builds an internal model of the external perturbing forces in intrinsic (muscles and / or joints) coordinates.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Comunicación presentada en las X Jornadas de Redes de Investigación en Docencia Universitaria, Alicante, 16-17 junio 2012.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Studies on positive plant–plant relations have traditionally focused on pair-wise interactions. Conversely, the interaction with other co-occurring species has scarcely been addressed, despite the fact that the entire community may affect plant performance. We used woody vegetation patches as models to evaluate community facilitation in semi-arid steppes. We characterized biotic and physical attributes of 53 woody patches (patch size, litter accumulation, canopy density, vegetation cover, species number and identity, and phylogenetic distance), and soil fertility (organic C and total N), and evaluated their relative importance for the performance of seedlings of Pistacia lentiscus, a keystone woody species in western Mediterranean steppes. Seedlings were planted underneath the patches, and on their northern and southern edges. Woody patches positively affected seedling survival but not seedling growth. Soil fertility was higher underneath the patches than elsewhere. Physical and biotic attributes of woody patches affected seedling survival, but these effects depended on microsite conditions. The composition of the community of small shrubs and perennial grasses growing underneath the patches controlled seedling performance. An increase in Stipa tenacissima and a decrease in Brachypodium retusum increased the probability of survival. The cover of these species and other small shrubs, litter depth and community phylogenetic distance, were also related to seedling survival. Seedlings planted on the northern edge of the patches were mostly affected by attributes of the biotic community. These traits were of lesser importance in seedlings planted underneath and in the southern edge of patches, suggesting that constraints to seedling establishment differed within the patches. Our study highlights the importance of taking into consideration community attributes over pair-wise interactions when evaluating the outcome of ecological interactions in multi-specific communities, as they have profound implications in the composition, function and management of semi-arid steppes.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Notre recherche a pour objectif général de proposer l’adaptation du concept de la relation d’échange superviseur-subordonné (leader-member exchange ou LMX) à la nouvelle réalité du travail à distance. Il s’agit d’étudier la relation d’échange qui se développe entre le superviseur et le subordonné travaillant à distance. Plus précisément, nous visons à définir et à développer une échelle de mesure valide et fiable du concept du LMX à distance. Jusqu’à présent, aucune définition de cette relation d’échange superviseur-subordonné n'a été proposée et aucune échelle de mesure n'a été développée. Dans l’étude que nous proposons, la notion de la distance n’est pas considérée comme un élément contextuel, mais plutôt un élément indissociable du concept lui-même, contrairement à certaines études qui ont examiné la distance comme modérateur de la relation entre le LMX et ses résultantes (Bligh et Riggio, 2012; Brunelle, 2013). À cet effet, cette étude constitue la première sur le sujet. Étant donné l'importance du LMX à distance pour les travailleurs à distance et dont le nombre atteindrait plus de 50 % d’ici 2020 (ITIF, CAS et CoreNet Global), il est primordial de comprendre et d'analyser la relation d’échange superviseur-subordonné à distance afin de mieux comprendre sa nature et son processus de développement, ce qui permettra aux parties de la dyade superviseur-subordonné de mieux s’adapter à cette nouvelle réalité de travail et de développer des relations d’échanges de qualité. Cette recherche aidera les superviseurs travaillant à distance à mieux gérer leur potentiel humain. Pour cerner ce sujet de recherche, nous avons fait une revue approfondie de la littérature traitant du LMX traditionnel et de la notion de distance, et ce, afin de pouvoir proposer une définition du concept du LMX à distance. En outre, nous avons fait appel aux recommandations de la littérature portant sur la psychométrie et nous avons réalisé une étude exploratoire de nature qualitative pour développer son échelle de mesure. Nous avons donc effectué des entrevues individuelles semi-dirigées auprès de trente professeurs d’une université canadienne. Ces entrevues ont été analysées avec le logiciel qualitatif spécialisé Nvivo et ont permis de présenter une première échelle de mesure du LMX à distance composée de sept dimensions et de 27 indicateurs. En somme, nous avons tenu à acquérir une meilleure compréhension de ce phénomène qui est très répandu dans les organisations modernes et à offrir une plateforme théorique et pratique que les chercheurs pourront utiliser pour enrichir leurs connaissances sur le concept du LMX à distance. Enfin, notre étude permettra aux superviseurs et aux subordonnés de comprendre l'importance de développer et de maintenir des relations de qualité conduisant à des résultats organisationnels et personnels positifs.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

La recherche d'informations s'intéresse, entre autres, à répondre à des questions comme: est-ce qu'un document est pertinent à une requête ? Est-ce que deux requêtes ou deux documents sont similaires ? Comment la similarité entre deux requêtes ou documents peut être utilisée pour améliorer l'estimation de la pertinence ? Pour donner réponse à ces questions, il est nécessaire d'associer chaque document et requête à des représentations interprétables par ordinateur. Une fois ces représentations estimées, la similarité peut correspondre, par exemple, à une distance ou une divergence qui opère dans l'espace de représentation. On admet généralement que la qualité d'une représentation a un impact direct sur l'erreur d'estimation par rapport à la vraie pertinence, jugée par un humain. Estimer de bonnes représentations des documents et des requêtes a longtemps été un problème central de la recherche d'informations. Le but de cette thèse est de proposer des nouvelles méthodes pour estimer les représentations des documents et des requêtes, la relation de pertinence entre eux et ainsi modestement avancer l'état de l'art du domaine. Nous présentons quatre articles publiés dans des conférences internationales et un article publié dans un forum d'évaluation. Les deux premiers articles concernent des méthodes qui créent l'espace de représentation selon une connaissance à priori sur les caractéristiques qui sont importantes pour la tâche à accomplir. Ceux-ci nous amènent à présenter un nouveau modèle de recherche d'informations qui diffère des modèles existants sur le plan théorique et de l'efficacité expérimentale. Les deux derniers articles marquent un changement fondamental dans l'approche de construction des représentations. Ils bénéficient notamment de l'intérêt de recherche dont les techniques d'apprentissage profond par réseaux de neurones, ou deep learning, ont fait récemment l'objet. Ces modèles d'apprentissage élicitent automatiquement les caractéristiques importantes pour la tâche demandée à partir d'une quantité importante de données. Nous nous intéressons à la modélisation des relations sémantiques entre documents et requêtes ainsi qu'entre deux ou plusieurs requêtes. Ces derniers articles marquent les premières applications de l'apprentissage de représentations par réseaux de neurones à la recherche d'informations. Les modèles proposés ont aussi produit une performance améliorée sur des collections de test standard. Nos travaux nous mènent à la conclusion générale suivante: la performance en recherche d'informations pourrait drastiquement être améliorée en se basant sur les approches d'apprentissage de représentations.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Notre recherche a pour objectif général de proposer l’adaptation du concept de la relation d’échange superviseur-subordonné (leader-member exchange ou LMX) à la nouvelle réalité du travail à distance. Il s’agit d’étudier la relation d’échange qui se développe entre le superviseur et le subordonné travaillant à distance. Plus précisément, nous visons à définir et à développer une échelle de mesure valide et fiable du concept du LMX à distance. Jusqu’à présent, aucune définition de cette relation d’échange superviseur-subordonné n'a été proposée et aucune échelle de mesure n'a été développée. Dans l’étude que nous proposons, la notion de la distance n’est pas considérée comme un élément contextuel, mais plutôt un élément indissociable du concept lui-même, contrairement à certaines études qui ont examiné la distance comme modérateur de la relation entre le LMX et ses résultantes (Bligh et Riggio, 2012; Brunelle, 2013). À cet effet, cette étude constitue la première sur le sujet. Étant donné l'importance du LMX à distance pour les travailleurs à distance et dont le nombre atteindrait plus de 50 % d’ici 2020 (ITIF, CAS et CoreNet Global), il est primordial de comprendre et d'analyser la relation d’échange superviseur-subordonné à distance afin de mieux comprendre sa nature et son processus de développement, ce qui permettra aux parties de la dyade superviseur-subordonné de mieux s’adapter à cette nouvelle réalité de travail et de développer des relations d’échanges de qualité. Cette recherche aidera les superviseurs travaillant à distance à mieux gérer leur potentiel humain. Pour cerner ce sujet de recherche, nous avons fait une revue approfondie de la littérature traitant du LMX traditionnel et de la notion de distance, et ce, afin de pouvoir proposer une définition du concept du LMX à distance. En outre, nous avons fait appel aux recommandations de la littérature portant sur la psychométrie et nous avons réalisé une étude exploratoire de nature qualitative pour développer son échelle de mesure. Nous avons donc effectué des entrevues individuelles semi-dirigées auprès de trente professeurs d’une université canadienne. Ces entrevues ont été analysées avec le logiciel qualitatif spécialisé Nvivo et ont permis de présenter une première échelle de mesure du LMX à distance composée de sept dimensions et de 27 indicateurs. En somme, nous avons tenu à acquérir une meilleure compréhension de ce phénomène qui est très répandu dans les organisations modernes et à offrir une plateforme théorique et pratique que les chercheurs pourront utiliser pour enrichir leurs connaissances sur le concept du LMX à distance. Enfin, notre étude permettra aux superviseurs et aux subordonnés de comprendre l'importance de développer et de maintenir des relations de qualité conduisant à des résultats organisationnels et personnels positifs.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

La recherche d'informations s'intéresse, entre autres, à répondre à des questions comme: est-ce qu'un document est pertinent à une requête ? Est-ce que deux requêtes ou deux documents sont similaires ? Comment la similarité entre deux requêtes ou documents peut être utilisée pour améliorer l'estimation de la pertinence ? Pour donner réponse à ces questions, il est nécessaire d'associer chaque document et requête à des représentations interprétables par ordinateur. Une fois ces représentations estimées, la similarité peut correspondre, par exemple, à une distance ou une divergence qui opère dans l'espace de représentation. On admet généralement que la qualité d'une représentation a un impact direct sur l'erreur d'estimation par rapport à la vraie pertinence, jugée par un humain. Estimer de bonnes représentations des documents et des requêtes a longtemps été un problème central de la recherche d'informations. Le but de cette thèse est de proposer des nouvelles méthodes pour estimer les représentations des documents et des requêtes, la relation de pertinence entre eux et ainsi modestement avancer l'état de l'art du domaine. Nous présentons quatre articles publiés dans des conférences internationales et un article publié dans un forum d'évaluation. Les deux premiers articles concernent des méthodes qui créent l'espace de représentation selon une connaissance à priori sur les caractéristiques qui sont importantes pour la tâche à accomplir. Ceux-ci nous amènent à présenter un nouveau modèle de recherche d'informations qui diffère des modèles existants sur le plan théorique et de l'efficacité expérimentale. Les deux derniers articles marquent un changement fondamental dans l'approche de construction des représentations. Ils bénéficient notamment de l'intérêt de recherche dont les techniques d'apprentissage profond par réseaux de neurones, ou deep learning, ont fait récemment l'objet. Ces modèles d'apprentissage élicitent automatiquement les caractéristiques importantes pour la tâche demandée à partir d'une quantité importante de données. Nous nous intéressons à la modélisation des relations sémantiques entre documents et requêtes ainsi qu'entre deux ou plusieurs requêtes. Ces derniers articles marquent les premières applications de l'apprentissage de représentations par réseaux de neurones à la recherche d'informations. Les modèles proposés ont aussi produit une performance améliorée sur des collections de test standard. Nos travaux nous mènent à la conclusion générale suivante: la performance en recherche d'informations pourrait drastiquement être améliorée en se basant sur les approches d'apprentissage de représentations.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

National Highway Traffic Safety Administration, Washington, D.C.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Thesis (Ph.D.)--University of Washington, 2016-05