Codex Search: propuesta e implementación de un sistema de recuperación de información de ámbito local basado en casos


Autoria(s): Martí Antonín, Maria Antònia
Contribuinte(s)

Agència de Gestió d'Ajuts Universitaris i de Recerca

Universitat de Barcelona. Centre de Llenguatge i Computació

Data(s)

27/04/2009

Resumo

CODEX SEARCH es un motor de recuperación de información especializado en derecho de extranjería que está basado en herramientas y conocimiento lingüísticos. Un motor o Sistema de Recuperación de Información (SRI) es un software capaz de localizar información en grandes colecciones documentales (entorno no trivial) en formato electrónico. Mediante un estudio previo se ha detectado que la extranjería es un ámbito discursivo en el que resulta difícil expresar la necesidad de información en términos de una consulta formal, objeto de los sistemas de recuperación actuales. Por lo tanto, para desarrollar un SRI eficiente en el dominio indicado no basta con emplear un modelo tradicional de RI, es decir, comparar los términos de la pregunta con los de la respuesta, básicamente porque no expresan implicaciones y porque no tiene que haber necesariamente una relación 1 a 1. En este sentido, la solución lingüística propuesta se basa en incorporar el conocimiento del especialista mediante la integración en el sistema de una librería de casos. Los casos son ejemplos de procedimientos aplicados por expertos a la solución de problemas que han ocurrido en la realidad y que han terminado en éxito o fracaso. Los resultados obtenidos en esta primera fase son muy alentadores pero es necesario continuar la investigación en este campo para mejorar el rendimiento del prototipo al que se puede acceder desde &http://161.116.36.139/~codex/&.

CODEX SEARCH is an engine to recover information related to “immigration law” topic, based on linguistic tools and knowledge. An engine or Retrieval Information System (SRI) is a software able to locate information within large documentary collections (not trivial environment) in electronic format. It has been detected, through a previous study that “immigration law” is a discursive area in which it is difficult to express clearly what a person wants to know, in terms of a formal query, which is a fundamental aim of the current retrieval systems. Therefore, in order to develop an efficient SRI appropriate to the indicated domain, it is not enough to use a IR traditional model, that is, comparing the terms of the question with those of the answer, basically because they do not express implications and because there must not necessarily be a one-to-one relationship. According to this, the suggested linguistic solution is based on including the specialist’s knowledge through integrating a store of cases into the system. The cases are examples of procedures applied by experts to the solution of problems that have happened in the reality even they have finished successfully or not. The results obtained in this first phase are very encouraging but it is necessary to continue the research in this field, in order to improve the output of the prototype that can be entered from &http://161.116.36.139/~codex/&.

Formato

63 p.

305980 bytes

application/pdf

Identificador

http://hdl.handle.net/2072/15546

Idioma(s)

spa

Relação

Els ajuts de l'AGAUR;2005AMIC10006

Direitos

Aquest document està subjecte a una llicència d'ús de Creative Commons, amb la qual es permet copiar, distribuir i comunicar públicament l'obra sempre que se'n citin l'autor original i l’Agència i no se'n faci cap ús comercial ni obra derivada, tal com queda estipulat en la llicència d'ús (http://creativecommons.org/licenses/by-nc-nd/2.5/es/)

Palavras-Chave #Informació -- Sistemes d'emmagatzematge i recuperació – Dret #Indexació (Documentació) #Immigració #8 - Lingüística i literatura
Tipo

info:eu-repo/semantics/article