Tekstikatkelmahakumenetelmien toteuttaminen tiedonhakujärjestelmässä
Contribuinte(s) |
Helsingin yliopisto, matemaattis-luonnontieteellinen tiedekunta, tietojenkäsittelytieteen laitos Helsingfors universitet, matematisk-naturvetenskapliga fakulteten, institutionen för datavetenskap University of Helsinki, Faculty of Science, Department of Computer Science |
---|---|
Data(s) |
02/04/2007
|
Resumo |
Information retrieval of concise and consistent text passages is called passage retrieval. Passages can be used in an information retrieval system to improve its user interface and performance. In this thesis passage retrieval is compared to other forms of information retrieval. Implementation of passage retrieval as a feature of an information retrieval system is discussed. Various existing passage retrieval methods, their implementation and their efficiency are compared. I evaluated two different implementations of passage retrieval: direct passage retrieval and combined passage retrieval. In comparison combined passage retrieval turned out to be more efficient. Tekstikatkelmahaku on tiedonhaun muoto, jossa käsiteltävä tietoyksikkö on lyhyt ja aiheeltaan yhtenäinen katkelma tekstiä. Tekstikatkelmia käyttämällä voidaan pyrkiä parantamaan esimerkiksi tiedonhakujärjestelmän käyttöliittymää ja tiedonhakujärjestelmän suorituskykyä. Tässä tutkielmassa vertaillaan tekstikatkelmahaun ominaisuuksia muihin tiedonhaun muotoihin. Lisäksi tutustutaan tarkemmin siihen, miten tekstikatkelmahaku voidaan toteuttaa osaksi tiedonhakujärjestelmää. Tutkielmassa käydään läpi erilaisia tekstikatkelmahaun menetelmiä, joita on käsitelty tiedonhaun kirjallisuudessa. Lisäksi käsitellään näiden menetelmien soveltamista käytännössä ja näiden käytännön toteutusten suorituskykyä. Tutkielmassa esitellään kaksi tekstikatkelmahaun toteutustapaa, suora katkelmahaku ja yhdistetty katkelmahaku. Näiden toteutustapojen suorituskykyä verrattiin kokeellisesti toisiinsa. Yhdistetty katkelmahaku osoittautui kokeen perusteella suorituskyvyltään paremmaksi toteutustavaksi. |
Identificador |
URN:NBN:fi-fe20071444 |
Idioma(s) |
fi |
Publicador |
Helsingin yliopisto Helsingfors universitet University of Helsinki |
Direitos |
Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty. This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited. Publikationen är skyddad av upphovsrätten. Den får läsas och skrivas ut för personligt bruk. Användning i kommersiellt syfte är förbjuden. |
Tipo |
Pro gradu Master's thesis Pro gradu Text |