Computational Methods for Reconstruction and Analysis of Genome-Scale Metabolic Networks


Autoria(s): Pitkänen, Esa
Contribuinte(s)

Helsingin yliopisto, matemaattis-luonnontieteellinen tiedekunta, tietojenkäsittelytieteen laitos

Helsingfors universitet, matematisk-naturvetenskapliga fakulteten, institutionen för datavetenskap

University of Helsinki, Faculty of Science, Department of Computer Science

Data(s)

12/11/2010

Resumo

Metabolism is the cellular subsystem responsible for generation of energy from nutrients and production of building blocks for larger macromolecules. Computational and statistical modeling of metabolism is vital to many disciplines including bioengineering, the study of diseases, drug target identification, and understanding the evolution of metabolism. In this thesis, we propose efficient computational methods for metabolic modeling. The techniques presented are targeted particularly at the analysis of large metabolic models encompassing the whole metabolism of one or several organisms. We concentrate on three major themes of metabolic modeling: metabolic pathway analysis, metabolic reconstruction and the study of evolution of metabolism. In the first part of this thesis, we study metabolic pathway analysis. We propose a novel modeling framework called gapless modeling to study biochemically viable metabolic networks and pathways. In addition, we investigate the utilization of atom-level information on metabolism to improve the quality of pathway analyses. We describe efficient algorithms for discovering both gapless and atom-level metabolic pathways, and conduct experiments with large-scale metabolic networks. The presented gapless approach offers a compromise in terms of complexity and feasibility between the previous graph-theoretic and stoichiometric approaches to metabolic modeling. Gapless pathway analysis shows that microbial metabolic networks are not as robust to random damage as suggested by previous studies. Furthermore the amino acid biosynthesis pathways of the fungal species Trichoderma reesei discovered from atom-level data are shown to closely correspond to those of Saccharomyces cerevisiae. In the second part, we propose computational methods for metabolic reconstruction in the gapless modeling framework. We study the task of reconstructing a metabolic network that does not suffer from connectivity problems. Such problems often limit the usability of reconstructed models, and typically require a significant amount of manual postprocessing. We formulate gapless metabolic reconstruction as an optimization problem and propose an efficient divide-and-conquer strategy to solve it with real-world instances. We also describe computational techniques for solving problems stemming from ambiguities in metabolite naming. These techniques have been implemented in a web-based sofware ReMatch intended for reconstruction of models for 13C metabolic flux analysis. In the third part, we extend our scope from single to multiple metabolic networks and propose an algorithm for inferring gapless metabolic networks of ancestral species from phylogenetic data. Experimenting with 16 fungal species, we show that the method is able to generate results that are easily interpretable and that provide hypotheses about the evolution of metabolism.

Aineenvaihdunta on yhteisnimitys solussa tapahtuville prosesseille, joissa solu tuottaa toiminnassaan tarvitsemansa raaka-aineet ja energian ravinteista. Koska aineenvaihdunta muodostaa perustan koko elämälle, on sen tutkiminen välttämätöntä eri aloilla, kuten lääketieteessä: monet sairaudet, kuten diabetes, johtuvat aineenvaihdunnan häiriöistä. Aineenvaihduntaan osallistuvia pieniä molekyylejä kutsutaan metaboliiteiksi. Metaboliitit, kuten sokerit ja aminohapot, muokkautuvat entsyymien katalysoimissa reaktioissa. Peräkkäisten reaktioiden muodostamia ketjuja kutsutaan aineenvaihduntareiteiksi. Aineenvaihduntareittien muodostamaa kokonaisuutta on luonnollista kuvata verkkomalleina, jotka kuvaavat ravinteiden kulkeutumista aineenvaihdunnan läpi lopputuotteiksi ja energiaksi. Uudet mittausmenetelmät mahdollistavat aineenvaihdunnan tutkimisen solutasolla. Mittausmenetelmien tuottaman datan suuri määrä asettaa uusia haasteita: datan täysimääräinen hyödyntäminen vaatii laskennallisia menetelmiä. Tässä väitöskirjatyössä esitellään uusia laskennallisia menetelmiä aineenvaihdunnan mallintamiseksi verkkoina. Työssä keskitytään erityisesti kolmeen tutkimuskysymykseen. Ensimmäiseksi tutkitaan, miten voidaan löytää biologisesti merkittäviä, metaboliitteja toisiinsa yhdistäviä aineenvaihduntareittejä. Reittien etsinnässä hyödynnetään tietoa sekä kaikista tunnetuista solussa tapahtuvista reaktioista että perimän sisältämästä entsyymien rakennusohjeista. Samalla esitellään uusi mallinnustapa, joka perustuu aineenvaihdunnan esittämiseen yhtenäisinä verkkoina: verkon tulee pystyä tuottamaan kunkin mallissa käytettävän reaktion lähtöaineet ravinteista. Näin vältetään aikaisempien mallinnustapojen epärealistinen oletus aineenvaihduntareitillä tarvittavien metaboliittien rajoittamattomasta saatavuudesta. Toisena pääteemana väitöskirjatyössä selvitetään lajikohtaisten aineenvaihdunnan verkkomallien muodostamista perimä- ja reaktiotiedon perusteella. Työssä esiteltävät uudet menetelmät soveltuvat suurten, koko aineenvaihdunnan kattavien mallien laatimiseen. Menetelmien muodostamat mallit ovat yhtenäisiä, mikä helpottaa niiden tulkintaa ja jatkokäsittelyä. Työssä esitellään ohjelmisto aineenvaihduntamallien laatimiseen erityisesti reaktionopeuksien arvioimiseksi isotooppileimauskokeiden tuottaman datan perusteella. Väitöskirjassa kuvattu ohjelmisto liittää aineenvaihduntamalliin tässä tarkastelussa välttämättömän tiedon siitä, miten yksittäiset atomit kulkeutuvat aineenvaihdunnassa ravinteista lähtien. Ohjelmisto tukee myös eri tietokannoissa käytettävien metaboliittien nimennän moniselitteisyyden selvittämistä. Lopuksi väitöskirjassa käsitellään aineenvaihdunnan evoluutioon liittyviä laskennallisia kysymyksiä. Työssä esitellään menetelmä, jonka avulla on mahdollista tehdä päätelmiä nykyisten lajien esi-isälajien aineenvaihdunnan rakenteesta. Menetelmä perustuu oletukseen kunkin esi-isälajin aineenvaihdunnan yhtenäisyydestä ja käyttää lähtötietona aineenvaihduntaverkkoa kullekin käsiteltävälle nykyiselle lajille ja tietoa lajien sukulaisuussuhteista.

Identificador

URN:ISBN:978-952-10-6642-9

http://hdl.handle.net/10138/21328

Idioma(s)

en

Publicador

Helsingin yliopisto

Helsingfors universitet

University of Helsinki

Relação

URN:ISBN:978-952-10-6641-2

Helsinki: 2010, Series of publications / Department of Computer Science, University of Helsinki. A. 1238-8645

Direitos

Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.

This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.

Publikationen är skyddad av upphovsrätten. Den får läsas och skrivas ut för personligt bruk. Användning i kommersiellt syfte är förbjuden.

Palavras-Chave #tietojenkäsittelytiede
Tipo

Väitöskirja (artikkeli)

Doctoral dissertation (article-based)

Doktorsavhandling (sammanläggning)

Text