896 resultados para Whole genome mapping
Resumo:
Les facteurs de transcription sont des protéines spécialisées qui jouent un rôle important dans différents processus biologiques tel que la différenciation, le cycle cellulaire et la tumorigenèse. Ils régulent la transcription des gènes en se fixant sur des séquences d’ADN spécifiques (éléments cis-régulateurs). L’identification de ces éléments est une étape cruciale dans la compréhension des réseaux de régulation des gènes. Avec l’avènement des technologies de séquençage à haut débit, l’identification de tout les éléments fonctionnels dans les génomes, incluant gènes et éléments cis-régulateurs a connu une avancée considérable. Alors qu’on est arrivé à estimer le nombre de gènes chez différentes espèces, l’information sur les éléments qui contrôlent et orchestrent la régulation de ces gènes est encore mal définie. Grace aux techniques de ChIP-chip et de ChIP-séquençage il est possible d’identifier toutes les régions du génome qui sont liées par un facteur de transcription d’intérêt. Plusieurs approches computationnelles ont été développées pour prédire les sites fixés par les facteurs de transcription. Ces approches sont classées en deux catégories principales: les algorithmes énumératifs et probabilistes. Toutefois, plusieurs études ont montré que ces approches génèrent des taux élevés de faux négatifs et de faux positifs ce qui rend difficile l’interprétation des résultats et par conséquent leur validation expérimentale. Dans cette thèse, nous avons ciblé deux objectifs. Le premier objectif a été de développer une nouvelle approche pour la découverte des sites de fixation des facteurs de transcription à l’ADN (SAMD-ChIP) adaptée aux données de ChIP-chip et de ChIP-séquençage. Notre approche implémente un algorithme hybride qui combine les deux stratégies énumérative et probabiliste, afin d’exploiter les performances de chacune d’entre elles. Notre approche a montré ses performances, comparée aux outils de découvertes de motifs existants sur des jeux de données simulées et des jeux de données de ChIP-chip et de ChIP-séquençage. SAMD-ChIP présente aussi l’avantage d’exploiter les propriétés de distributions des sites liés par les facteurs de transcription autour du centre des régions liées afin de limiter la prédiction aux motifs qui sont enrichis dans une fenêtre de longueur fixe autour du centre de ces régions. Les facteurs de transcription agissent rarement seuls. Ils forment souvent des complexes pour interagir avec l’ADN pour réguler leurs gènes cibles. Ces interactions impliquent des facteurs de transcription dont les sites de fixation à l’ADN sont localisés proches les uns des autres ou bien médier par des boucles de chromatine. Notre deuxième objectif a été d’exploiter la proximité spatiale des sites liés par les facteurs de transcription dans les régions de ChIP-chip et de ChIP-séquençage pour développer une approche pour la prédiction des motifs composites (motifs composés par deux sites et séparés par un espacement de taille fixe). Nous avons testé ce module pour prédire la co-localisation entre les deux demi-sites ERE qui forment le site ERE, lié par le récepteur des œstrogènes ERα. Ce module a été incorporé à notre outil de découverte de motifs SAMD-ChIP.
Resumo:
La leucémie myéloïde aigüe (LMA) est la forme de leucémie la plus fréquente chez l’adulte au Canada. Bien que de nombreux réarrangements chromosomiques récurrents aient été identifiés chez les patients LMA, près de la moitié des cas présentent un caryotype normal (LMA-CN). L’étude de la LMA-CN in vitro est rendue difficile par le fait que la survie des cellules primaires de patients est défectueuse sur le long terme et que les lignées cellulaires leucémiques ont un caryotype hautement anormal. En 2009, Munker et son équipe ont établi une nouvelle lignée cellulaire, CG-SH, ayant la particularité d’avoir un caryotype normal. L’objectif principal de ce projet d’étude est de caractériser plus en détail ce nouveau modèle d’étude. Nous avons identifié l’ensemble des variants génétiques présents dans CG-SH grâce au séquençage du génome entier. Les variants susceptibles de participer à la leucémogénèse ont été isolés, tels que des insertions détectées dans EZH2 et GATA2, et de nombreux variants faux-sens détectés dans des gènes pertinents pour la LMA. Nous avons montré que les cellules CG-SH sont sensibles à l’effet prolifératif d’une combinaison de cytokines, qui agissent sur le comportement des cellules en modifiant l’expression des gènes associés à la régulation de la prolifération, de l’apoptose et de la différentiation. De plus, les cytokines diminuent le taux de nécrose des cellules en culture sur le court terme. La présente étude a permis d’approfondir notre connaissance sur les caractéristiques moléculaires de la lignée cellulaire CG-SH, un nouveau modèle d’étude in vitro de la LMA-CN.
Resumo:
La duplication est un des évènements évolutifs les plus importants, car elle peut mener à la création de nouvelles fonctions géniques. Durant leur évolution, les génomes sont aussi affectés par des inversions, des translocations (incluant des fusions et fissions de chromosomes), des transpositions et des délétions. L'étude de l'évolution des génomes est importante, notamment pour mieux comprendre les mécanismes biologiques impliqués, les types d'évènements qui sont les plus fréquents et quels étaient les contenus en gènes des espèces ancestrales. Afin d'analyser ces différents aspects de l'évolution des génomes, des algorithmes efficaces doivent être créés pour inférer des génomes ancestraux, des histoires évolutives, des relations d'homologies et pour calculer les distances entre les génomes. Dans cette thèse, quatre projets reliés à l'étude et à l'analyse de l'évolution des génomes sont présentés : 1) Nous proposons deux algorithmes pour résoudre des problèmes reliés à la duplication de génome entier : un qui généralise le problème du genome halving aux pertes de gènes et un qui permet de calculer la double distance avec pertes. 2) Nous présentons une nouvelle méthode pour l'inférence d'histoires évolutives de groupes de gènes orthologues répétés en tandem. 3) Nous proposons une nouvelle approche basée sur la théorie des graphes pour inférer des gènes in-paralogues qui considère simultanément l'information provenant de différentes espèces afin de faire de meilleures prédictions. 4) Nous présentons une étude de l'histoire évolutive des gènes d'ARN de transfert chez 50 souches de Bacillus.
Resumo:
Des études antérieures démontrent que les descendants de peuples européens et africains présentent des différences de susceptibilité à certaines maladies infectieuses. Ces différences suggèrent des variations interpopulationnelles de la réponse immunitaire qui résultent probablement de l’adaptation de ces individus aux pathogènes de leur environnement. Nous avons caractérisé la réponse immunitaire chez des descendants de peuples européens et africains à des infections bactériennes. Nous avons infecté des macrophages dérivés de monocytes de 30 Américains d’origine africaine (Africains) et de 31 Américains d’origine européenne (Européens) avec les pathogènes intracellulaires Listeria monocytogenes et Salmonella typhimurium pendant 4 heures, puis nous avons mesuré le niveau d’expression pangénomique des cellules infectées et non infectées par séquençage de l’ARNm. Nous avons estimé le niveau de contrôle de l’infection par les macrophages à 2, 4 et 24 heures post-infection en évaluant le taux de survie des bactéries. Nous avons observé que les Africains présentent significativement moins de bactéries intracellulaires après 4 et 24 heures que les Européens, suggérant que les Africains contrôlent mieux les infections bactériennes. Nous avons identifié des différences interpopulationnelles dans le niveau de sécrétion des cytokines et dans le niveau d’expression de certains gènes, ce qui suggère que les Africains modulent une réponse inflammatoire plus forte que les Européens. Nous avons démontré que plusieurs de ces gènes ont subi des évènements de sélection positive récents seulement chez les Européens. Notre étude a identifié plusieurs gènes candidats susceptibles d’influencer le cours des infections bactériennes chez les humains. Nos résultats indiquent que les différences dans la progression des maladies infectieuses entre les populations européennes et africaines seraient le résultat de la sélection naturelle.
Resumo:
Les champignons mycorhiziens arbusculaires (CMA) sont très répandus dans le sol où ils forment des associations symbiotiques avec la majorité des plantes appelées mycorhizes arbusculaires. Le développement des CMA dépend fortement de la plante hôte, de telle sorte qu'ils ne peuvent vivre à l'état saprotrophique, par conséquent ils sont considérés comme des biotrophes obligatoires. Les CMA forment une lignée évolutive basale des champignons et ils appartiennent au phylum Glomeromycota. Leurs mycélia sont formés d’un réseau d’hyphes cénocytiques dans lesquelles les noyaux et les organites cellulaires peuvent se déplacer librement d’un compartiment à l’autre. Les CMA permettent à la plante hôte de bénéficier d'une meilleure nutrition minérale, grâce au réseau d'hyphes extraradiculaires, qui s'étend au-delà de la zone du sol explorée par les racines. Ces hyphes possèdent une grande capacité d'absorption d’éléments nutritifs qui vont être transportés par ceux-ci jusqu’aux racines. De ce fait, les CMA améliorent la croissance des plantes tout en les protégeant des stresses biotiques et abiotiques. Malgré l’importance des CMA, leurs génétique et évolution demeurent peu connues. Leurs études sont ardues à cause de leur mode de vie qui empêche leur culture en absence des plantes hôtes. En plus leur diversité génétique intra-isolat des génomes nucléaires, complique d’avantage ces études, en particulier le développement des marqueurs moléculaires pour des études biologiques, écologiques ainsi que les fonctions des CMA. C’est pour ces raisons que les génomes mitochondriaux offrent des opportunités et alternatives intéressantes pour étudier les CMA. En effet, les génomes mitochondriaux (mt) publiés à date, ne montrent pas de polymorphismes génétique intra-isolats. Cependant, des exceptions peuvent exister. Pour aller de l’avant avec la génomique mitochondriale, nous avons besoin de générer beaucoup de données de séquençages de l’ADN mitochondrial (ADNmt) afin d’étudier les méchanismes évolutifs, la génétique des population, l’écologie des communautés et la fonction des CMA. Dans ce contexte, l’objectif de mon projet de doctorat consiste à: 1) étudier l’évolution des génomes mt en utilisant l’approche de la génomique comparative au niveau des espèces proches, des isolats ainsi que des espèces phylogénétiquement éloignées chez les CMA; 2) étudier l’hérédité génétique des génomes mt au sein des isolats de l’espèce modèle Rhizophagus irregularis par le biais des anastomoses ; 3) étudier l’organisation des ADNmt et les gènes mt pour le développement des marqueurs moléculaires pour des études phylogénétiques. Nous avons utilisé l’approche dite ‘whole genome shotgun’ en pyroséquençage 454 et Illumina HiSeq pour séquencer plusieurs taxons de CMA sélectionnés selon leur importance et leur disponibilité. Les assemblages de novo, le séquençage conventionnel Sanger, l’annotation et la génomique comparative ont été réalisés pour caractériser des ADNmt complets. Nous avons découvert plusieurs mécanismes évolutifs intéressant chez l’espèce Gigaspora rosea dans laquelle le génome mt est complètement remanié en comparaison avec Rhizophagus irregularis isolat DAOM 197198. En plus nous avons mis en évidence que deux gènes cox1 et rns sont fragmentés en deux morceaux. Nous avons démontré que les ARN transcrits les deux fragments de cox1 se relient entre eux par épissage en trans ‘Trans-splicing’ à l’aide de l’ARN du gene nad5 I3 qui met ensemble les deux ARN cox1.1 et cox1.2 en formant un ARN complet et fonctionnel. Nous avons aussi trouvé une organisation de l’ADNmt très particulière chez l’espèce Rhizophagus sp. Isolat DAOM 213198 dont le génome mt est constitué par deux chromosomes circulaires. En plus nous avons trouvé une quantité considérable des séquences apparentées aux plasmides ‘plasmid-related sequences’ chez les Glomeraceae par rapport aux Gigasporaceae, contribuant ainsi à une évolution rapide des ADNmt chez les Glomeromycota. Nous avons aussi séquencé plusieurs isolats de l’espèces R. irregularis et Rhizophagus sp. pour décortiquer leur position phylogénéque et inférer des relations évolutives entre celles-ci. La comparaison génomique mt nous montré l’existence de plusieurs éléments mobiles comme : des cadres de lecture ‘open reading frames (mORFs)’, des séquences courtes inversées ‘short inverted repeats (SIRs)’, et des séquences apparentées aux plasimdes ‘plasmid-related sequences (dpo)’ qui impactent l’ordre des gènes mt et permettent le remaniement chromosomiques des ADNmt. Tous ces divers mécanismes évolutifs observés au niveau des isolats, nous permettent de développer des marqueurs moléculaires spécifiques à chaque isolat ou espèce de CMA. Les données générées dans mon projet de doctorat ont permis d’avancer les connaissances fondamentales des génomes mitochondriaux non seulement chez les Glomeromycètes, mais aussi de chez le règne des Fungi et les eucaryotes en général. Les trousses moléculaires développées dans ce projet peuvent servir à des études de la génétique des populations, des échanges génétiques et l’écologie des CMA ce qui va contribuer à la compréhension du rôle primorial des CMA en agriculture et environnement.
Resumo:
Les fichiers accompagnant le document sont en format Microsoft Excel 2010.
Resumo:
Identifying the genetic changes driving adaptive variation in natural populations is key to understanding the origins of biodiversity. The mosaic of mimetic wing patterns in Heliconius butterflies makes an excellent system for exploring adaptive variation using next-generation sequencing. In this study, we use a combination of techniques to annotate the genomic interval modulating red color pattern variation, identify a narrow region responsible for adaptive divergence and convergence in Heliconius wing color patterns, and explore the evolutionary history of these adaptive alleles. We use whole genome resequencing from four hybrid zones between divergent color pattern races of Heliconius erato and two hybrid zones of the co-mimic Heliconius melpomene to examine genetic variation across 2.2 Mb of a partial reference sequence. In the intergenic region near optix, the gene previously shown to be responsible for the complex red pattern variation in Heliconius, population genetic analyses identify a shared 65-kb region of divergence that includes several sites perfectly associated with phenotype within each species. This region likely contains multiple cis-regulatory elements that control discrete expression domains of optix. The parallel signatures of genetic differentiation in H. erato and H. melpomene support a shared genetic architecture between the two distantly related co-mimics; however, phylogenetic analysis suggests mimetic patterns in each species evolved independently. Using a combination of next-generation sequencing analyses, we have refined our understanding of the genetic architecture of wing pattern variation in Heliconius and gained important insights into the evolution of novel adaptive phenotypes in natural populations.
Resumo:
Mean platelet volume (MPV) and platelet count (PLT) are highly heritable and tightly regulated traits. We performed a genome-wide association study for MPV and identified one SNP, rs342293, as having highly significant and reproducible association with MPV (per-G allele effect 0.016 +/- 0.001 log fL; P < 1.08 x 10(-24)) and PLT (per-G effect -4.55 +/- 0.80 10(9)/L; P < 7.19 x 10(-8)) in 8586 healthy subjects. Whole-genome expression analysis in the 1-MB region showed a significant association with platelet transcript levels for PIK3CG (n = 35; P = .047). The G allele at rs342293 was also associated with decreased binding of annexin V to platelets activated with collagen-related peptide (n = 84; P = .003). The region 7q22.3 identifies the first QTL influencing platelet volume, counts, and function in healthy subjects. Notably, the association signal maps to a chromosome region implicated in myeloid malignancies, indicating this site as an important regulatory site for hematopoiesis. The identification of loci regulating MPV by this and other studies will increase our insight in the processes of megakaryopoiesis and proplatelet formation, and it may aid the identification of genes that are somatically mutated in essential thrombocytosis. (Blood. 2009; 113: 3831-3837)
Resumo:
We know little about the genomic events that led to the advent of a multicellular grade of organization in animals, one of the most dramatic transitions in evolution. Metazoan multicellularity is correlated with the evolution of embryogenesis, which presumably was underpinned by a gene regulatory network reliant on the differential activation of signaling pathways and transcription factors. Many transcription factor genes that play critical roles in bilaterian development largely appear to have evolved before the divergence of cnidarian and bilaterian lineages. In contrast, sponges seem to have a more limited suite of transcription factors, suggesting that the developmental regulatory gene repertoire changed markedly during early metazoan evolution. Using whole- genome information from the sponge Amphimedon queenslandica, a range of eumetazoans, and the choanoflagellate Monosiga brevicollis, we investigate the genesis and expansion of homeobox, Sox, T- box, and Fox transcription factor genes. Comparative analyses reveal that novel transcription factor domains ( such as Paired, POU, and T- box) arose very early in metazoan evolution, prior to the separation of extant metazoan phyla but after the divergence of choanoflagellate and metazoan lineages. Phylogenetic analyses indicate that transcription factor classes then gradually expanded at the base of Metazoa before the bilaterian radiation, with each class following a different evolutionary trajectory. Based on the limited number of transcription factors in the Amphimedon genome, we infer that the genome of the metazoan last common ancestor included fewer gene members in each class than are present in extant eumetazoans. Transcription factor orthologues present in sponge, cnidarian, and bilaterian genomes may represent part of the core metazoan regulatory network underlying the origin of animal development and multicellularity.
Resumo:
Endogenous formation of N-nitroso compounds (NOCs), which are known animal carcinogens, could contribute to human carcinogenesis but definitive evidence is still lacking. To investigate the relevance of NOCs in human colorectal cancer (CRC) development, we analyzed whole genome gene expression modifications in human colon biopsies in relation to fecal NOC exposure. We had a particular interest in patients suffering from intestinal inflammation as this may stimulate endogenous NOC formation, and consequently predispose to CRC risk. Inflammatory bowel disease (IBD) patients diagnosed with ulcerative colitis and irritable bowel syndrome patients without inflammation, serving as controls, were therefore recruited. Fecal NOC were demonstrated in the majority of subjects. By associating gene expression levels of all subjects to fecal NOC levels, we identified a NOC exposure-associated transcriptomic response that suggests that physiological NOC concentrations may potentially induce genotoxic responses and chromatin modifications in human colon tissue, both of which are linked to carcinogenicity. In a network analysis, chromatin modifications were linked to 11 significantly modulated histone genes, pointing towards a possible epigenetic mechanism that may be relevant in comprehending NOC-induced carcinogenesis. In addition, pro-inflammatory transcriptomic modifications were identified in visually non-inflamed regions of the IBD colon. However, fecal NOC levels were slightly but not significantly increased in IBD patients, suggesting that inflammation did not strongly stimulate NOC formation. We conclude that NOC exposure is associated with gene expression modifications in the human colon that may suggest a potential role of these compounds in CRC development.
Resumo:
Over the past decade genomic approaches have begun to revolutionise the study of animal diversity. In particular, genome sequencing programmes have spread beyond the traditional model species to encompass an increasing diversity of animals from many different phyla, as well as unicellular eukaryotes that are closely related to the animals. Whole genome sequences allow researchers to establish, with reasonable confidence, the full complement of any particular family of genes in a genome. Comparison of gene complements from appropriate genomes can reveal the evolutionary history of gene families, indicating when both gene diversification and gene loss have occurred. More than that, however, assembled genomes allow the genomic environment in which individual genes are found to be analysed and compared between species. This can reveal how gene diversification occurred. Here, we focus on the Fox genes, drawing from multiple animal genomes to develop an evolutionary framework explaining the timing and mechanism of origin of the diversity of animal Fox genes. Ancient linkages between genes are a prominent feature of the Fox genes, depicting a history of gene clusters, some of which may be relevant to understanding Fox gene function.
Resumo:
Whole-genome sequencing offers new insights into the evolution of bacterial pathogens and the etiology of bacterial disease. Staph- ylococcus aureus is a major cause of bacteria-associated mortality and invasive disease and is carried asymptomatically by 27% of adults. Eighty percent of bacteremias match the carried strain. How- ever, the role of evolutionary change in the pathogen during the progression from carriage to disease is incompletely understood. Here we use high-throughput genome sequencing to discover the genetic changes that accompany the transition from nasal carriage to fatal bloodstream infection in an individual colonized with meth- icillin-sensitive S. aureus. We found a single, cohesive population exhibiting a repertoire of 30 single-nucleotide polymorphisms and four insertion/deletion variants. Mutations accumulated at a steady rate over a 13-mo period, except for a cluster of mutations preceding the transition to disease. Although bloodstream bacteria differed by just eight mutations from the original nasally carried bacteria, half of those mutations caused truncation of proteins, including a prema- ture stop codon in an AraC-family transcriptional regulator that has been implicated in pathogenicity. Comparison with evolution in two asymptomatic carriers supported the conclusion that clusters of pro- tein-truncating mutations are highly unusual. Our results demon- strate that bacterial diversity in vivo is limited but nonetheless detectable by whole-genome sequencing, enabling the study of evolutionary dynamics within the host. Regulatory or structural changes that occur during carriage may be functionally important for pathogenesis; therefore identifying those changes is a crucial step in understanding the biological causes of invasive bacterial disease.
Resumo:
Whole-genome transcriptome profiling is revealing how biological systems are regulated at the transcriptional level. This study reports the development of a robust method to profile and compare the transcriptomes of two nonmodel plant species, Thlaspi caerulescens, a zinc (Zn) hyperaccumulator, and Thlaspi arvense, a nonhyperaccumulator, using Affymetrix Arabidopsis thaliana ATH1-121501 GeneChip (R) arrays (Affymetrix, Santa Clara, CA, USA). Transcript abundance was quantified in the shoots of agar- and compost-grown plants of both species. Analyses were optimized using a genomic DNA (gDNA)-based probe-selection strategy based on the hybridization efficiency of Thlaspi gDNA with corresponding A. thaliana probes. In silico alignments of GeneChip (R) probes with Thlaspi gene sequences, and quantitative real-time PCR, confirmed the validity of this approach. Approximately 5000 genes were differentially expressed in the shoots of T. caerulescens compared with T. arvense, including genes involved in Zn transport and compartmentalization. Future functional analyses of genes identified as differentially expressed in the shoots of these closely related species will improve our understanding of the molecular mechanisms of Zn hyperaccumulation.
Resumo:
Background We previously reported an association between 5HTTLPR genotype and outcome following cognitive–behavioural therapy (CBT) in child anxiety (Cohort 1). Children homozygous for the low-expression short-allele showed more positive outcomes. Other similar studies have produced mixed results, with most reporting no association between genotype and CBT outcome. Aims To replicate the association between 5HTTLPR and CBT outcome in child anxiety from the Genes for Treatment study (GxT Cohort 2, n = 829). Method Logistic and linear mixed effects models were used to examine the relationship between 5HTTLPR and CBT outcomes. Mega-analyses using both cohorts were performed. Results There was no significant effect of 5HTTLPR on CBT outcomes in Cohort 2. Mega-analyses identified a significant association between 5HTTLPR and remission from all anxiety disorders at follow-up (odds ratio 0.45, P = 0.014), but not primary anxiety disorder outcomes. Conclusions The association between 5HTTLPR genotype and CBT outcome did not replicate. Short-allele homozygotes showed more positive treatment outcomes, but with small, non-significant effects. Future studies would benefit from utilising whole genome approaches and large, homogenous samples.
Resumo:
Adult human neural crest-derived stem cells (NCSCs) are of extraordinary high plasticity and promising candidates for the use in regenerative medicine. Here we describe for the first time a novel neural crest-derived stem cell population within the respiratory epithelium of human adult inferior turbinate. In contrast to superior and middle turbinates, high amounts of source material could be isolated from human inferior turbinates. Using minimally-invasive surgery methods isolation is efficient even in older patients. Within their endogenous niche, inferior turbinate stem cells (ITSCs) expressed high levels of nestin, p75(NTR), and S100. Immunoelectron microscopy using anti-p75 antibodies displayed that ITSCs are of glial origin and closely related to nonmyelinating Schwann cells. Cultivated ITSCs were positive for nestin and S100 and the neural crest markers Slug and SOX10. Whole genome microarray analysis showed pronounced differences to human ES cells in respect to pluripotency markers OCT4, SOX2, LIN28, and NANOG, whereas expression of WDR5, KLF4, and c-MYC was nearly similar. ITSCs were able to differentiate into cells with neuro-ectodermal and mesodermal phenotype. Additionally ITSCs are able to survive and perform neural crest typical chain migration in vivo when transplanted into chicken embryos. However ITSCs do not form teratomas in severe combined immunodeficient mice. Finally, we developed a separation strategy based on magnetic cell sorting of p75(NTR) positive ITSCs that formed larger neurospheres and proliferated faster than p75(NTR) negative ITSCs. Taken together our study describes a novel, readily accessible source of multipotent human NCSCs for potential cell-replacement therapy.