The Most Probable Bayesian Network and Beyond


Autoria(s): Silander, Tomi
Contribuinte(s)

Helsingin yliopisto, matemaattis-luonnontieteellinen tiedekunta, tietojenkäsittelytieteen laitos

Helsingfors universitet, matematisk-naturvetenskapliga fakulteten, institutionen för datavetenskap

University of Helsinki, Faculty of Science, Department of Computer Science

Data(s)

30/05/2009

Resumo

This doctoral dissertation introduces an algorithm for constructing the most probable Bayesian network from data for small domains. The algorithm is used to show that a popular goodness criterion for the Bayesian networks has a severe sensitivity problem. The dissertation then proposes an information theoretic criterion that avoids the problem.

Bayesverkko on havainnollinen verkkokaavio, jossa verkon solmut kuvaavat ongelmakentän asioita ja solmujen väliset kaaret kuvaavat asioiden välisiä tilastollisia yhteyksiä. Bayesverkkojen havainnollisuuden vuoksi niiden automaattinen tuottaminen pelkän kerätyn tietoaineiston pohjalta on mielenkiintoinen tehtävä. Vaan millainen bayesverkko on hyvä kuvaus ongelmakentästä, ja mitä hyvyydellä tarkasti ottaen tarkoitetaan. Yleisimmin käytetty hyvyyden mitta on verkon bayesilainen todennäköisyys; mitä suuremmalta verkon todennäköisyys näyttää kerätyn aineiston perusteella, sitä parempi verkko on. Bayesilaisen todennäköisyyden laskeminen kerätyn aineiston avulla vaatii kuitenkin, että meillä on alustava ajatus eri verkkojen todennäköisyyksistä ja verkossa olevien yhteyksien vahvuuksista jo ennen aineiston käyttämistä todennäköisyyksien laskemiseen. Verkkojen automaattisessa oppimisessa nämä ennakkokäsitykset pyritään usein pitämään mahdollisimman lievinä, jotta itse aineisto saisi vaikuttaa mahdollisimman paljon parhaan verkon valintaan eikä mitään verkkoa suosittaisi etukäteen. Puolueeton asenne yhteyksien vahvuuteen on kuitenkin vaikea käsitteellinen ongelma, ja asian formalisoiminen eksaktisti voidaan tehdä monella eri tavalla. Tässä väitöskirjassa esitetään menetelmä todennäköisimmän verkon löytämiseksi. Menetelmän avulla on voitu osoittaa, että mitättömän pienet erot yhteyksien luonnetta koskevissa ennakkokäsityksissä aiheuttavat muutoksia todennäköisimmän verkon rakenteeseen. Asian korjaamiseksi työssä ehdotetaan uutta tapaa mitata verkkojen hyvyyttä. Uusi tapa perustuu informaatioteoriaan, eikä se vaadi aineistoa edeltävien ennakkokäsitysten määrittelyä.

Identificador

URN:ISBN:978-952-10-5524-9

http://hdl.handle.net/10138/21364

Idioma(s)

en

Publicador

Helsingin yliopisto

Helsingfors universitet

University of Helsinki

Relação

URN:ISBN:978-952-10-5523-2

Helsinki: 2009, Department of Computer Science Series of Publications A. 1238-8645

Direitos

Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.

This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.

Publikationen är skyddad av upphovsrätten. Den får läsas och skrivas ut för personligt bruk. Användning i kommersiellt syfte är förbjuden.

Palavras-Chave #tietojenkäsittelytiede
Tipo

Väitöskirja (artikkeli)

Doctoral dissertation (article-based)

Doktorsavhandling (sammanläggning)

Text