Ilmiöiden automaattinen ennustaminen hakukonetilastojen avulla


Autoria(s): Soiluva, Sami
Data(s)

08/06/2016

08/06/2016

08/06/2016

Resumo

Web-hakukoneiden merkitys tiedonhaussa on noussut merkittävään asemaan viimeisten vuosikymmenten aikana. Vaikka tiedonhaku hakukoneella on hyvin suoraviivaista, ihmiset käyttäytyvät hakukoneissa eri tavoilla. Tämän tutkielman aiheena on tutkia ihmisten hakukonekäyttäytymistä ja yrittää löytää tapoja hyödyntää näitä tutkimustuloksia. Tutkielmassa käytetään aineistona keskeisiä hakukoneiden perusteita käsitteleviä teoksia, joiden avulla käydään läpi hakukoneiden toimintalogiikkaa sekä hakukonetilastojen hyödyntämismahdollisuuksista löytyvää kirjallisuutta. Tutkielman tutkimusosuus hyödyntää Googlen tarjoamia työkaluja, joiden avulla päästään käsiksi ihmisten hakukonekäyttäytymiseen avainsanojen ja näiden hakuajankohtien osalta. Tutkimusosuudessa aiheena on ennustaa vuoden 2015 eduskuntavaalien viiden suurimman puolueen ääniosuudet. Ennustus tehtiin tutkimalla ihmisten hakukonekäyttäytymistä viiden edeltävän vaalin aikana ja suhteuttamalla nämä käyttäytymismallit tiedettyihin vaalituloksiin. Tehtiin hypoteesi, että suurempi hakuvolyymi johtaa suurempaan ääniosuuteen ja valittiin lineaarinen regressio ennustusmalliksi. Ennustusmalli toimi hyvin ja keskimääräinen virhemarginaali ääniosuuden ennustuksessa oli 2,90 %-yksikköä. Perussuomalaisten tulos oli yllätyksellinen ja ilman sitä ennustuksen keskimääräinen virhemarginaali oli 1,34 %-yksikköä. Tutkimustulosten perusteella nähdään hakukonetutkimusten potentiaali. Vaikka vaalitulosten ennustamiseen käytetty tietomäärä oli hyvin suppea, saatiin silti aikaan julkaisukelpoisia tuloksia. Näiden tulosten mukaan näyttää siltä, että Googlen hakutilastojen avulla on mahdollista ennustaa ihmisten valinnoista riippuvia nykymaailman tapahtumia lähitulevaisuuteen.

Identificador

http://www.doria.fi/handle/10024/124159

Idioma(s)

fi