Biblioteca Digital

919 resultados para Information retrieval

Enhancing information retrieval in folksonomies using ontology of place constructed from Gazetteer information

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Dissertation submitted in partial fulfilment of the requirements for the Degree of Master of Science in Geospatial Technologies

Veja mais

Automatic information retrieval through text-mining

Relevância:

100.00% 100.00%

Publicador:

Resumo:

The dissertation presented for obtaining the Master��s Degree in Electrical Engineering and Computer Science, at Universidade Nova de Lisboa, Faculdade de Ci��ncias e Tecnologia

Veja mais

Meaning refinement to improve cross-lingual information retrieval

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Magdeburg, Univ., Fak. f��r Informatik, Diss., 2012

Veja mais

The Uexku��ll approach : evaluation of multivariate data organizations for support of visual information retrieval

Relevância:

100.00% 100.00%

Publicador:

Veja mais

Extracting and exploiting word relationships for information retrieval

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Th��se num��ris��e par la Division de la gestion de documents et des archives de l'Universit�� de Montr��al

Veja mais

Concept oriented biomedical information retrieval

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Le domaine biom��dical est probablement le domaine o�� il y a les ressources les plus riches. Dans ces ressources, on regroupe les diff��rentes expressions exprimant un concept, et d��finit des relations entre les concepts. Ces ressources sont construites pour faciliter l��acc��s aux informations dans le domaine. On pense g��n��ralement que ces ressources sont utiles pour la recherche d��information biom��dicale. Or, les r��sultats obtenus jusqu�� pr��sent sont mitig��s : dans certaines ��tudes, l��utilisation des concepts a pu augmenter la performance de recherche, mais dans d��autres ��tudes, on a plut��t observ�� des baisses de performance. Cependant, ces r��sultats restent difficilement comparables ��tant donn�� qu��ils ont ��t�� obtenus sur des collections diff��rentes. Il reste encore une question ouverte si et comment ces ressources peuvent aider �� am��liorer la recherche d��information biom��dicale. Dans ce m��moire, nous comparons les diff��rentes approches bas��es sur des concepts dans un m��me cadre, notamment l��approche utilisant les identificateurs de concept comme unit�� de repr��sentation, et l��approche utilisant des expressions synonymes pour ��tendre la requ��te initiale. En comparaison avec l��approche traditionnelle de "sac de mots", nos r��sultats d��exp��rimentation montrent que la premi��re approche d��grade toujours la performance, mais la seconde approche peut am��liorer la performance. En particulier, en appariant les expressions de concepts comme des syntagmes stricts ou flexibles, certaines m��thodes peuvent apporter des am��liorations significatives non seulement par rapport �� la m��thode de "sac de mots" de base, mais aussi par rapport �� la m��thode de Champ Al��atoire Markov (Markov Random Field) qui est une m��thode de l��tat de l��art dans le domaine. Ces r��sultats montrent que quand les concepts sont utilis��s de fa��on appropri��e, ils peuvent grandement contribuer �� am��liorer la performance de recherche d��information biom��dicale. Nous avons particip�� au laboratoire d��valuation ShARe/CLEF 2014 eHealth. Notre r��sultat ��tait le meilleur parmi tous les syst��mes participants.

Veja mais

Relating Dependent Terms in Information Retrieval

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Les moteurs de recherche font partie de notre vie quotidienne. Actuellement, plus d��un tiers de la population mondiale utilise l��Internet. Les moteurs de recherche leur permettent de trouver rapidement les informations ou les produits qu'ils veulent. La recherche d'information (IR) est le fondement de moteurs de recherche modernes. Les approches traditionnelles de recherche d'information supposent que les termes d'indexation sont ind��pendants. Pourtant, les termes qui apparaissent dans le m��me contexte sont souvent d��pendants. L��absence de la prise en compte de ces d��pendances est une des causes de l��introduction de bruit dans le r��sultat (r��sultat non pertinents). Certaines ��tudes ont propos�� d��int��grer certains types de d��pendance, tels que la proximit��, la cooccurrence, la contigu��t�� et de la d��pendance grammaticale. Dans la plupart des cas, les mod��les de d��pendance sont construits s��par��ment et ensuite combin��s avec le mod��le traditionnel de mots avec une importance constante. Par cons��quent, ils ne peuvent pas capturer correctement la d��pendance variable et la force de d��pendance. Par exemple, la d��pendance entre les mots adjacents "Black Friday" est plus importante que celle entre les mots "road constructions". Dans cette th��se, nous ��tudions diff��rentes approches pour capturer les relations des termes et de leurs forces de d��pendance. Nous avons propos�� des m��thodes suivantes: �� Nous r��examinons l'approche de combinaison en utilisant diff��rentes unit��s d'indexation pour la RI monolingue en chinois et la RI translinguistique entre anglais et chinois. En plus d��utiliser des mots, nous ��tudions la possibilit�� d'utiliser bi-gramme et uni-gramme comme unit�� de traduction pour le chinois. Plusieurs mod��les de traduction sont construits pour traduire des mots anglais en uni-grammes, bi-grammes et mots chinois avec un corpus parall��le. Une requ��te en anglais est ensuite traduite de plusieurs fa��ons, et un score classement est produit avec chaque traduction. Le score final de classement combine tous ces types de traduction. Nous consid��rons la d��pendance entre les termes en utilisant la th��orie d��vidence de Dempster-Shafer. Une occurrence d'un fragment de texte (de plusieurs mots) dans un document est consid��r��e comme repr��sentant l'ensemble de tous les termes constituants. La probabilit�� est assign��e �� un tel ensemble de termes plut��t qu��a chaque terme individuel. Au moment d��valuation de requ��te, cette probabilit�� est redistribu��e aux termes de la requ��te si ces derniers sont diff��rents. Cette approche nous permet d'int��grer les relations de d��pendance entre les termes. Nous proposons un mod��le discriminant pour int��grer les diff��rentes types de d��pendance selon leur force et leur utilit�� pour la RI. Notamment, nous consid��rons la d��pendance de contigu��t�� et de cooccurrence �� de diff��rentes distances, c��est-��-dire les bi-grammes et les paires de termes dans une fen��tre de 2, 4, 8 et 16 mots. Le poids d��un bi-gramme ou d��une paire de termes d��pendants est d��termin�� selon un ensemble des caract��res, en utilisant la r��gression SVM. Toutes les m��thodes propos��es sont ��valu��es sur plusieurs collections en anglais et/ou chinois, et les r��sultats exp��rimentaux montrent que ces m��thodes produisent des am��liorations substantielles sur l'��tat de l'art.

Veja mais

Intelligent Agent-based Multilingual Information Retrieval System

Relevância:

100.00% 100.00%

Publicador:

Resumo:

The goal of this work is to develop an Open Agent Architecture for Multilingual information retrieval from Relational Database. The query for information retrieval can be given in plain Hindi or Malayalam; two prominent regional languages of India. The system supports distributed processing of user requests through collaborating agents. Natural language processing techniques are used for meaning extraction from the plain query and information is given back to the user in his/ her native language. The system architecture is designed in a structured way so that it can be adapted to other regional languages of India

Veja mais

English-Malayalam Cross-Lingual Information Retrieval �� an Experience

Relevância:

100.00% 100.00%

Publicador:

Resumo:

This paper describes about an English-Malayalam Cross-Lingual Information Retrieval system. The system retrieves Malayalam documents in response to query given in English or Malayalam. Thus monolingual information retrieval is also supported in this system. Malayalam is one of the most prominent regional languages of Indian subcontinent. It is spoken by more than 37 million people and is the native language of Kerala state in India. Since we neither had any full-fledged online bilingual dictionary nor any parallel corpora to build the statistical lexicon, we used a bilingual dictionary developed in house for translation. Other language specific resources like Malayalam stemmer, Malayalam morphological root analyzer etc developed in house were used in this work

Veja mais

Information Retrieval

Relevância:

100.00% 100.00%

Publicador:

Veja mais

Implementing Information Retrieval Systems

Relevância:

100.00% 100.00%

Publicador:

Veja mais

Information Retrieval

Relevância:

100.00% 100.00%

Publicador:

Veja mais

Information Retrieval

Relevância:

100.00% 100.00%

Publicador:

Veja mais

Information retrieval

Relevância:

100.00% 100.00%

Publicador:

Veja mais

Parallel Monte Carlo algorithms for information retrieval

Relevância:

100.00% 100.00%

Publicador:

Resumo:

In any data mining applications, automated text and text and image retrieval of information is needed. This becomes essential with the growth of the Internet and digital libraries. Our approach is based on the latent semantic indexing (LSI) and the corresponding term-by-document matrix suggested by Berry and his co-authors. Instead of using deterministic methods to find the required number of first "k" singular triplets, we propose a stochastic approach. First, we use Monte Carlo method to sample and to build much smaller size term-by-document matrix (e.g. we build k x k matrix) from where we then find the first "k" triplets using standard deterministic methods. Second, we investigate how we can reduce the problem to finding the "k"-largest eigenvalues using parallel Monte Carlo methods. We apply these methods to the initial matrix and also to the reduced one. The algorithms are running on a cluster of workstations under MPI and results of the experiments arising in textual retrieval of Web documents as well as comparison of the stochastic methods proposed are presented. (C) 2003 IMACS. Published by Elsevier Science B.V. All rights reserved.

Veja mais

919 resultados para Information retrieval

Filtro por publicador