Computational Methods for Detecting Large-Scale Chromosome Rearrangements in SNP Data


Autoria(s): Kollin, Jussi
Contribuinte(s)

Helsingin yliopisto, matemaattis-luonnontieteellinen tiedekunta, tietojenkäsittelytieteen laitos

Helsingfors universitet, matematisk-naturvetenskapliga fakulteten, institutionen för datavetenskap

University of Helsinki, Faculty of Science, Department of Computer Science

Helsinki Institute for Information Technology

Data(s)

25/10/2010

Resumo

Large-scale chromosome rearrangements such as copy number variants (CNVs) and inversions encompass a considerable proportion of the genetic variation between human individuals. In a number of cases, they have been closely linked with various inheritable diseases. Single-nucleotide polymorphisms (SNPs) are another large part of the genetic variance between individuals. They are also typically abundant and their measuring is straightforward and cheap. This thesis presents computational means of using SNPs to detect the presence of inversions and deletions, a particular variety of CNVs. Technically, the inversion-detection algorithm detects the suppressed recombination rate between inverted and non-inverted haplotype populations whereas the deletion-detection algorithm uses the EM-algorithm to estimate the haplotype frequencies of a window with and without a deletion haplotype. As a contribution to population biology, a coalescent simulator for simulating inversion polymorphisms has been developed. Coalescent simulation is a backward-in-time method of modelling population ancestry. Technically, the simulator also models multiple crossovers by using the Counting model as the chiasma interference model. Finally, this thesis includes an experimental section. The aforementioned methods were tested on synthetic data to evaluate their power and specificity. They were also applied to the HapMap Phase II and Phase III data sets, yielding a number of candidates for previously unknown inversions, deletions and also correctly detecting known such rearrangements.

Ihmisten perimissä on yksilöllistä vaihtelua. Tämä vaihtelu voi olla useaa eri tyyppiä. Esimerkiksi yksittäisiä emäspareja koskettavat pistemutaatiot ovat usein helposti ja halvasti mitattavissa. Perimä voi kuitenkin vaihdella myös suuremmalla mittakaavalla. Osa perimästä voi olla joissakin tapauksissa kääntynyt toisin päin tai saattaa puuttua kokonaan; edellistä vaihtelutyyppiä kutsutaan inversioksi ja jälkimmäistä deletioksi. Inversioiden ja deletioiden tunnistaminen perimästä ei ole yhtä helppoa kuin pistemutaatioista seuranneiden SNP:ien (single nucleotide polymorphism) mittaaminen. Tässä väitöstyössä on kehitetty menetelmiä, jotka pyrkivät tunnistamaan inversioiden ja deletioiden jälkiä SNP-aineistoista. Menetelmien tavoitteena on ohjeistaa, mitä alueita perimästä on syytä tarkastella muilla tarkemmilla, mutta kalliimmilla, keinoilla tällaisten suurten perimämuutosten tunnistamiseksi. Väitöstyössä esitetään myös tietokoneohjelma, joka tuottaa inversion sisältäviä synteettisiä SNP-aineistoja. Tämän ohjelman avulla tarkastellaan eri inversiontunnistusmenetelmien toimivuutta erilaisissa koetilanteissa. Kokeiden mukaan tietynlaiset inversiot tunnistuvat kehitetyllä menetelmällä hyvin. Kehitettyjä menetelmiä sovellettiin useasta eri ihmispopulaatiosta kerätyn Hapmap-aineiston analysointiin. Tuloksena menetelmät antoivat jo aiemmin tunnettuja inversioita ja deletioita sekä uusia ehdokasalueita kokeellista validointia varten.

Identificador

URN:ISBN:978-952-10-6466-1

http://hdl.handle.net/10138/21329

Idioma(s)

en

Publicador

Helsingin yliopisto

Helsingfors universitet

University of Helsinki

Relação

URN:ISBN:978-952-10-6465-4

1238-8645

Direitos

Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.

This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.

Publikationen är skyddad av upphovsrätten. Den får läsas och skrivas ut för personligt bruk. Användning i kommersiellt syfte är förbjuden.

Palavras-Chave #tietojenkäsittelytiede
Tipo

Väitöskirja (monografia)

Doctoral dissertation (monograph)

Doktorsavhandling (monografi)

Text