Tekstikatkelmahakumenetelmien toteuttaminen tiedonhakujärjestelmässä


Autoria(s): Susi, Petteri
Contribuinte(s)

Helsingin yliopisto, matemaattis-luonnontieteellinen tiedekunta, tietojenkäsittelytieteen laitos

Helsingfors universitet, matematisk-naturvetenskapliga fakulteten, institutionen för datavetenskap

University of Helsinki, Faculty of Science, Department of Computer Science

Data(s)

02/04/2007

Resumo

Information retrieval of concise and consistent text passages is called passage retrieval. Passages can be used in an information retrieval system to improve its user interface and performance. In this thesis passage retrieval is compared to other forms of information retrieval. Implementation of passage retrieval as a feature of an information retrieval system is discussed. Various existing passage retrieval methods, their implementation and their efficiency are compared. I evaluated two different implementations of passage retrieval: direct passage retrieval and combined passage retrieval. In comparison combined passage retrieval turned out to be more efficient.

Tekstikatkelmahaku on tiedonhaun muoto, jossa käsiteltävä tietoyksikkö on lyhyt ja aiheeltaan yhtenäinen katkelma tekstiä. Tekstikatkelmia käyttämällä voidaan pyrkiä parantamaan esimerkiksi tiedonhakujärjestelmän käyttöliittymää ja tiedonhakujärjestelmän suorituskykyä. Tässä tutkielmassa vertaillaan tekstikatkelmahaun ominaisuuksia muihin tiedonhaun muotoihin. Lisäksi tutustutaan tarkemmin siihen, miten tekstikatkelmahaku voidaan toteuttaa osaksi tiedonhakujärjestelmää. Tutkielmassa käydään läpi erilaisia tekstikatkelmahaun menetelmiä, joita on käsitelty tiedonhaun kirjallisuudessa. Lisäksi käsitellään näiden menetelmien soveltamista käytännössä ja näiden käytännön toteutusten suorituskykyä. Tutkielmassa esitellään kaksi tekstikatkelmahaun toteutustapaa, suora katkelmahaku ja yhdistetty katkelmahaku. Näiden toteutustapojen suorituskykyä verrattiin kokeellisesti toisiinsa. Yhdistetty katkelmahaku osoittautui kokeen perusteella suorituskyvyltään paremmaksi toteutustavaksi.

Identificador

URN:NBN:fi-fe20071444

http://hdl.handle.net/10138/21444

Idioma(s)

fi

Publicador

Helsingin yliopisto

Helsingfors universitet

University of Helsinki

Direitos

Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.

This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.

Publikationen är skyddad av upphovsrätten. Den får läsas och skrivas ut för personligt bruk. Användning i kommersiellt syfte är förbjuden.

Tipo

Pro gradu

Master's thesis

Pro gradu

Text