894 resultados para Query expansion, Text mining, Information retrieval, Chinese IR


Relevância:

100.00% 100.00%

Publicador:

Resumo:

Dissertação de Mestrado, Ciências da Linguagem, Faculdade de Ciências Humanas e Sociais, Universidade do Algarve, 2010

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Ce mémoire tente de répondre à une problématique très importante dans le domaine de recrutement : l’appariement entre offre d’emploi et candidats. Dans notre cas nous disposons de milliers d’offres d’emploi et de millions de profils ramassés sur les sites dédiés et fournis par un industriel spécialisé dans le recrutement. Les offres d’emploi et les profils de candidats sur les réseaux sociaux professionnels sont généralement destinés à des lecteurs humains qui sont les recruteurs et les chercheurs d’emploi. Chercher à effectuer une sélection automatique de profils pour une offre d’emploi se heurte donc à certaines difficultés que nous avons cherché à résoudre dans le présent mémoire. Nous avons utilisé des techniques de traitement automatique de la langue naturelle pour extraire automatiquement les informations pertinentes dans une offre d’emploi afin de construite une requête qui nous permettrait d’interroger notre base de données de profils. Pour valider notre modèle d’extraction de métier, de compétences et de d’expérience, nous avons évalué ces trois différentes tâches séparément en nous basant sur une référence cent offres d’emploi canadiennes que nous avons manuellement annotée. Et pour valider notre outil d’appariement nous avons fait évaluer le résultat de l’appariement de dix offres d’emploi canadiennes par un expert en recrutement.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Ce mémoire tente de répondre à une problématique très importante dans le domaine de recrutement : l’appariement entre offre d’emploi et candidats. Dans notre cas nous disposons de milliers d’offres d’emploi et de millions de profils ramassés sur les sites dédiés et fournis par un industriel spécialisé dans le recrutement. Les offres d’emploi et les profils de candidats sur les réseaux sociaux professionnels sont généralement destinés à des lecteurs humains qui sont les recruteurs et les chercheurs d’emploi. Chercher à effectuer une sélection automatique de profils pour une offre d’emploi se heurte donc à certaines difficultés que nous avons cherché à résoudre dans le présent mémoire. Nous avons utilisé des techniques de traitement automatique de la langue naturelle pour extraire automatiquement les informations pertinentes dans une offre d’emploi afin de construite une requête qui nous permettrait d’interroger notre base de données de profils. Pour valider notre modèle d’extraction de métier, de compétences et de d’expérience, nous avons évalué ces trois différentes tâches séparément en nous basant sur une référence cent offres d’emploi canadiennes que nous avons manuellement annotée. Et pour valider notre outil d’appariement nous avons fait évaluer le résultat de l’appariement de dix offres d’emploi canadiennes par un expert en recrutement.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

La Web 2.0 ha tenido un enorme éxito gracias a la posibilidad de una interacción dinámica por parte del usuario, ya no sólo a la hora de participar en elementos colaborativos, como puedan ser los foros, sino en compartir/añadir contenido a la Web. Dos ejemplos claros de este paradigma son YouTube y Flickr. El primero hospeda la mayor parte de los vídeos que podemos encontrar en Internet, y el segundo ha creado la mayor comunidad de fotógrafos existente en la red. Ambos servicios funcionan de una forma similar, el usuario es el que aporta contenidos junto a una información asociada al mismo. Al ser comunidades internacionales, la información añadida por el usuario se realiza en diversos idiomas, por lo que la búsqueda de recursos multimedia en estos sitios es dependiente del idioma de la consulta. En este artículo, presentamos Babxel, un sistema de recuperación de información multimedia y multilingüe, nacido como proyecto de fin de carrera de Ingeniería Informática, como extensión y mejora de FlickrBabel. Babxel aprovecha la capacidad de traducción multilingüe automática para generar más resultados de búsqueda relacionado con la consulta del usuario, resultados que se obtienen de las plataformas mencionadas anteriormente.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Things change. Words change, meaning changes and use changes both words and meaning. In information access systems this means concept schemes such as thesauri or clas- sification schemes change. They always have. Concept schemes that have survived have evolved over time, moving from one version, often called an edition, to the next. If we want to manage how words and meanings - and as a conse- quence use - change in an effective manner, and if we want to be able to search across versions of concept schemes, we have to track these changes. This paper explores how we might expand SKOS, a World Wide Web Consortium (W3C) draft recommendation in order to do that kind of tracking.The Simple Knowledge Organization System (SKOS) Core Guide is sponsored by the Semantic Web Best Practices and Deployment Working Group. The second draft, edited by Alistair Miles and Dan Brickley, was issued in November 2005. SKOS is a “model for expressing the basic structure and content of concept schemes such as thesauri, classification schemes, subject heading lists, taxonomies, folksonomies, other types of controlled vocabulary and also concept schemes embedded in glossaries and terminologies” in RDF. How SKOS handles version in concept schemes is an open issue. The current draft guide suggests using OWL and DCTERMS as mechanisms for concept scheme revision.As it stands an editor of a concept scheme can make notes or declare in OWL that more than one version exists. This paper adds to the SKOS Core by introducing a tracking sys- tem for changes in concept schemes. We call this tracking system vocabulary ontogeny. Ontogeny is a biological term for the development of an organism during its lifetime. Here we use the ontogeny metaphor to describe how vocabularies change over their lifetime. Our purpose here is to create a conceptual mechanism that will track these changes and in so doing enhance information retrieval and prevent document loss through versioning, thereby enabling persistent retrieval.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

This paper outlines the purposes, predications, functions, and contexts of information organization frameworks; including: bibliographic control, information retrieval, resource discovery, resource description, open access scholarly indexing, personal information management protocols, and social tagging in order to compare and contrast those purposes, predications, functions, and contexts. Information organization frameworks, for the purpose of this paper, consist of information organization systems (classification schemes, taxonomies, ontologies, bibliographic descriptions, etc.), methods of conceiving of and creating the systems, and the work processes involved in maintaining these systems. The paper first outlines the theoretical literature of these information organization frameworks. In conclusion, this paper establishes the first part of an evaluation rubric for a function, predication, purpose, and context analysis.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Poussée par une croissance économique rapide ces trente dernières années, la demande chinoise en matières premières a considérablement augmenté au cours de cette période. Premier importateur mondial de nombreux minerais depuis le début du XXIe siècle, la Chine, qui n’est pas un État côtier de l’Arctique, semble attentive au potentiel économique de la région, et notamment en ce qui a trait à l’exploitation des gisements miniers. Avec l’ouverture relative des accès maritimes à travers les passages arctiques, les entreprises chinoises seraient en mesure d’effectuer des économies sur les coûts de transport et pourraient plus aisément accéder aux gisements miniers du Groenland et de l’Arctique canadien. La montée en puissance de l’économie chinoise, qui s’est concrétisée depuis le début du siècle, son affirmation politique sur la scène mondiale, et sa diplomatie des ressources perçue comme agressive a contribué à développer une perception négative de la Chine au sein des opinions publiques canadiennes, danoises, groenlandaises, et islandaises. Dans un contexte de débats et d’inquiétudes sur les questions de souveraineté dans l’Arctique, les presses canadiennes, groenlandaises et danoises ont contribué à construire, dans leurs opinions publiques respectives ces dernières années, une certaine sinophobie face aux investissements directs à l’étranger chinois, qui débutent réellement en 2005. Par exemple, un sondage mené en 2015 par l’Asia Pacific Foundation of Canada faisait ressortir que près de 76% de la population canadienne était hostile à l’acquisition d’entreprises canadiennes par des entreprises chinoises, tous secteurs confondus. Au Groenland, la perspective d’opérations minières dirigées par des entreprises chinoises a provoqué l’ire des médias danois et groenlandais. Alors que certains dénoncent une stratégie géopolitique chinoise plus large dans cette région du monde, d’autres mettent l’accent sur les implications de la venue de nombreux travailleurs chinois, de même que sur les questions d’une Chine cherchant à assurer un accès à long terme aux ressources de la région, prétextant que le Groenland serait une région d’investissement majeur pour les entreprises chinoises. La Chine, par l’entremise de ses entreprises, chercherait-elle à faire main basse sur les ressources minières de l’Arctique ? L’Arctique canadien, le Groenland et le Grand Nord québécois sont-ils des territoires d’investissements majeurs pour les entreprises chinoises ? Comment les facteurs qui déterminent les choix des entreprises chinoises se sont-ils traduits dans l’Arctique ? Dans le cadre de cette recherche, trente-six entreprises et organes du gouvernement ont été consultés. Les résultats de l’enquête soulignent que ces territoires ne sont pas des régions où les entreprises chinoises investissent d’importantes sommes, mais demeurent attractifs en raison de la stabilité politique et du climat compétitif des affaires qui y règnent, ainsi que pour la qualité des ressources physiques qu’on y retrouve. Cependant, les acteurs chinois soulignent d’importants défis tels que le déficit en matière d’infrastructures maritimes et de communication dans l’Arctique, le manque d’informations sur les opportunités d’affaires, c’est le cas des projets disponibles au Groenland notamment, et les acteurs chinois soulignent également leur manque d’expérience à l’international, de même que le coût et la disponibilité de la main-d’oeuvre comme des défis importants pour les entreprises chinoises. En somme, les investissements des entreprises chinoises dans des projets miniers dans l’Arctique canadien et au Groenland s’insèrent, certes, dans les stratégies globales des entreprises chinoises qui visent à diversifier et sécuriser leurs sources d’approvisionnements. En revanche, s’il apparaît que les territoires arctiques ne sont pas des régions d’investissements majeurs pour les entreprises chinoises dans le secteur extractif, les acteurs chinois sondés raisonnent, de manière générale, selon une logique de marché et recherchent donc, pour la plupart, à assurer la rentabilité de leur entreprise par la réalisation de gains. Outre les fluctuations des prix des matières premières sur les marchés mondiaux qui affectent grandement les opérations minières globales, de nombreux facteurs dans l’Arctique tels que l’éloignement, les conditions météorologiques extrêmes, et le manque d’infrastructures augmentent considérablement le coût de faire des affaires dans le secteur minier dans l’Arctique, qui demeure un marché niche.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Due to both the widespread and multipurpose use of document images and the current availability of a high number of document images repositories, robust information retrieval mechanisms and systems have been increasingly demanded. This paper presents an approach to support the automatic generation of relationships among document images by exploiting Latent Semantic Indexing (LSI) and Optical Character Recognition (OCR). We developed the LinkDI (Linking of Document Images) service, which extracts and indexes document images content, computes its latent semantics, and defines relationships among images as hyperlinks. LinkDI was experimented with document images repositories, and its performance was evaluated by comparing the quality of the relationships created among textual documents as well as among their respective document images. Considering those same document images, we ran further experiments in order to compare the performance of LinkDI when it exploits or not the LSI technique. Experimental results showed that LSI can mitigate the effects of usual OCR misrecognition, which reinforces the feasibility of LinkDI relating OCR output with high degradation.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

The article presents and discusses issues such as informativeness, offering of directions and information retrieval, and also lists definitions of information and mediation. Based on the topics presented, the possible problems faced by information professionals are discussed while cultural mediators in the context of art museums.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Formal Concept Analysis is an unsupervised machine learning technique that has successfully been applied to document organisation by considering documents as objects and keywords as attributes. The basic algorithms of Formal Concept Analysis then allow an intelligent information retrieval system to cluster documents according to keyword views. This paper investigates the scalability of this idea. In particular we present the results of applying spatial data structures to large datasets in formal concept analysis. Our experiments are motivated by the application of the Formal Concept Analysis idea of a virtual filesystem [11,17,15]. In particular the libferris [1] Semantic File System. This paper presents customizations to an RD-Tree Generalized Index Search Tree based index structure to better support the application of Formal Concept Analysis to large data sources.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

This paper reports the introduction of an evidence-based medicine fellowship in a children’s teaching hospital. The results are presented of a self-reported ‘evidence-based medicine’ questionnaire, the clinical questions requested through the information retrieval service are outlined and the results of an information retrieval service user questionnaire are reported. It was confirmed that clinicians have frequent clinical questions that mostly remain unanswered. The responses to four questions with ‘good quality’ evidence-based answers were reviewed and suggest that at least one-quarter of doctors were not aware of the current best available evidence. There was a high level of satisfaction with the information retrieval service; 19% of users indicated that the information changed their clinical practice and 73% indicated that the information confirmed their clinical practice. The introduction of an evidence-based medicine fellowship is one method of disseminating the practice of evidence-based medicine in a tertiary children’s hospital.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Trabalho de Projeto realizado para obtenção do grau de Mestre em Engenharia Informática e de Computadores

Relevância:

100.00% 100.00%

Publicador:

Resumo:

OBJECTIVE To analyze the methodology used for assessing the spatial distribution of specialized cardiac care units. METHODS A modeling and simulation method was adopted for the practical application of cardiac care service in the state of Santa Catarina, Southern Brazil, using the p-median model. As the state is divided into 21 health care regions, a methodology which suggests an arrangement of eight intermediate cardiac care units was analyzed, comparing the results obtained using data from 1996 and 2012. RESULTS Results obtained using data from 2012 indicated significant changes in the state, particularly in relation to the increased population density in the coastal regions. The current study provided a satisfactory response, indicated by the homogeneity of the results regarding the location of the intermediate cardiac care units and their respective regional administrations, thereby decreasing the average distance traveled by users to health care units, located in higher population density areas. The validity of the model was corroborated through the analysis of the allocation of the median vertices proposed in 1996 and 2012. CONCLUSIONS The current spatial distribution of specialized cardiac care units is more homogeneous and reflects the demographic changes that have occurred in the state over the last 17 years. The comparison between the two simulations and the current configuration showed the validity of the proposed model as an aid in decision making for system expansion.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Data analytic applications are characterized by large data sets that are subject to a series of processing phases. Some of these phases are executed sequentially but others can be executed concurrently or in parallel on clusters, grids or clouds. The MapReduce programming model has been applied to process large data sets in cluster and cloud environments. For developing an application using MapReduce there is a need to install/configure/access specific frameworks such as Apache Hadoop or Elastic MapReduce in Amazon Cloud. It would be desirable to provide more flexibility in adjusting such configurations according to the application characteristics. Furthermore the composition of the multiple phases of a data analytic application requires the specification of all the phases and their orchestration. The original MapReduce model and environment lacks flexible support for such configuration and composition. Recognizing that scientific workflows have been successfully applied to modeling complex applications, this paper describes our experiments on implementing MapReduce as subworkflows in the AWARD framework (Autonomic Workflow Activities Reconfigurable and Dynamic). A text mining data analytic application is modeled as a complex workflow with multiple phases, where individual workflow nodes support MapReduce computations. As in typical MapReduce environments, the end user only needs to define the application algorithms for input data processing and for the map and reduce functions. In the paper we present experimental results when using the AWARD framework to execute MapReduce workflows deployed over multiple Amazon EC2 (Elastic Compute Cloud) instances.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Dissertation submitted in partial fulfilment of the requirements for the Degree of Master of Science in Geospatial Technologies