957 resultados para WHOLE-GENOME AMPLIFICATION
Resumo:
The aim of this study was to clarify the clinical phenotype of late-onset spinal motor neuronopathy (LOSMoN), an adult-onset autosomal dominant lower motor neuron disorder identified first in two families in Eastern Finland, in order to clarify its genetic background. Motor neuron disorders (MNDs) are characterized by dysfunction and premature death of motor neurons in the brain and spinal cord. MNDs can manifest at any age of the human lifespan, ranging from pre- or neonatal forms such as spinal muscular atrophy type I (SMA I) to those preferentially affecting the older age groups exemplified by sporadic amyotrophic lateral sclerosis (ALS). With a combination of genetic linkage analysis and genome sequencing using DNA from a total of 55 affected members of 17 families and a whole genome scan, we were able to show that LOSMoN is caused by the c.197G>T p.G66V mutation in the gene CHCHD10. This study showed that LOSMoN has very characteristic features that help to differentiate it from other more malignant forms of motor neuron disease, such as ALS, which was erroneously diagnosed in many patients in our cohort. Lack of fibrillations in the first dorsal interosseus muscle on EMG and extensive grouping of non-atrophic type IIA/2A fibers on muscle biopsy were shown to be common findings in LOSMoN, but rare or absent in ALS patients. The results of this study will help clinicians recognize the characteristic phenotype of LOSMoN disease and thus improve their diagnostic accuracy, and will also allow physicians to provide adequate genetic counseling for patients.
Resumo:
The recent rapid development of biotechnological approaches has enabled the production of large whole genome level biological data sets. In order to handle thesedata sets, reliable and efficient automated tools and methods for data processingand result interpretation are required. Bioinformatics, as the field of studying andprocessing biological data, tries to answer this need by combining methods and approaches across computer science, statistics, mathematics and engineering to studyand process biological data. The need is also increasing for tools that can be used by the biological researchers themselves who may not have a strong statistical or computational background, which requires creating tools and pipelines with intuitive user interfaces, robust analysis workflows and strong emphasis on result reportingand visualization. Within this thesis, several data analysis tools and methods have been developed for analyzing high-throughput biological data sets. These approaches, coveringseveral aspects of high-throughput data analysis, are specifically aimed for gene expression and genotyping data although in principle they are suitable for analyzing other data types as well. Coherent handling of the data across the various data analysis steps is highly important in order to ensure robust and reliable results. Thus,robust data analysis workflows are also described, putting the developed tools andmethods into a wider context. The choice of the correct analysis method may also depend on the properties of the specific data setandthereforeguidelinesforchoosing an optimal method are given. The data analysis tools, methods and workflows developed within this thesis have been applied to several research studies, of which two representative examplesare included in the thesis. The first study focuses on spermatogenesis in murinetestis and the second one examines cell lineage specification in mouse embryonicstem cells.
Resumo:
The construction of adenovirus vectors for cloning and foreign gene expression requires packaging cell lines that can complement missing viral functions caused by sequence deletions and/or replacement with foreign DNA sequences. In this study, packaging cell lines were designed to provide in trans the missing bovine adenovirus functions, so that recombinant viruses could be generated. Fetal bovine kidney and lUng cells, acquired at the trimester term from a pregnant cow, were tranfected with both digested wild type BAV2 genomic DNA and pCMV-EI. The plasmid pCMV-EI was specifically constructed to express El of BAV2 under the control of the cytomegalovirus enhancer/promoter (CMV). Selection for "true" transformants by continuous passaging showed no success in isolating immortalised cells, since the cells underwent crisis resulting in complete cell death. Moreover, selection for G418 resistance, using the same cells, also did not result in the isolation of an immortalised cell line and the same culture-collapse event was observed. The lack of success in establishing an immortalised cell line from fetal tissue prompted us to transfect a pre-established cell line. We began by transfecting MDBK (Mardin-Dardy bovine kidney) cells with pCMV-El-neo, which contain the bacterial selectable marker neo gene. A series of MDBK-derived cell lines, that constitutively express bovine adenoviral (BAV) early region 1 (El), were then isolated. Cells selected for resistance to the drug G418 were isolated collectively for full characterisation to assess their suitability as packaging cell lines. Individual colonies were isolated by limiting dilution and further tested for El expression and efficiency of DNA uptake. Two cell lines, L-23 and L-24, out of 48 generated foci tested positive for £1 expression using Northern Blot analysis. DNA uptake studies, using both lipofectamine and calcium phosphate methods, were performed to compare these cells, their parental MDBK cells, 8 and the unrelated human 293 cells as a benchmark. The results revealed that the new MDBKderived clones were no more efficient than MDBK cells in the transient expression of transfected DNA and that they were inferior to 293 cells, when using lacZ as the reporter gene. In view of the inherently poor transfection efficiency of MDBK cells and their derivatives, a number of other bovine cells were investigated for their potential as packaging cells. The cell line CCL40 was chosen for its high efficiency in DNA uptake and subsequently transfected with the plasmid vector pCMV El-neo. By selection with the drug G418, two cell lines were isolated, ProCell 1 and ProCell 2. These cell lines were tested for El expression, permissivity to BAV2 and DNA uptake efficiency, revealing a DNA uptake efficiency of 37 % , comparable to that of CCL40. Attempts to rescue BAV2 mutants carrying the lacZ gene in place of £1 or £3 were carried out by co-transfecting wild type viral DNA with either the plasmid pdlElE-Z (which contains BAV2 sequences from 0% to 40.4% with the lacZ gene in place of the £1 region from 1.1% to 8.25%) or with the plasmid pdlE3-5-Z (which contains BAV2 sequences from 64.8% to 100% with the lacZ gene in place of the E3 region from 75.8% to 81.4%). These cotransfections did not result in the generation of a viral mutant. The lack of mutant generation was thought to be caused by the relative inefficiency ofDNA uptake. Consequently, cosBAV2, a cosmid vector carrying the BAV2 genome, was modified to carry the neo reporter gene in place of the £3 region from 75.8% to 81.4%. The use of a single cosmid vector earring the whole genome would eliminate the need for homologous recombination in order to generate a viral vector. Unfortunately, the transfection of cosBAV2- neo also did not result in the generation of a viral mutant. This may have been caused by the size of the £3 deletion, where excess sequences that are essential to the virus' survival might have been deleted. As an extension to this study, the spontaneous E3 deletion, accidently discovered in our viral stock, could be used as site of foreign gene insertion.
Resumo:
MicroRNAs (miRNAs) are a class of short (similar to 22nt), single stranded RNA molecules that function as post-transcriptional regulators of gene expression. MiRNAs can regulate a variety of important biological pathways, including: cellular proliferation, differentiation and apoptosis. Profiling of miRNA expression patterns was shown to be more useful than the equivalent mRNA profiles for characterizing poorly differentiated tumours. As such, miRNA expression "signatures" are expected to offer serious potential for diagnosing and prognosing cancers of any provenance. The aim of this study was to investigate the potential of using deregulation of urinary miRNAs in order to detect Prostate Cancer (PCa) among Benign Prostatic Hyperplasia (BPH). To identify the miRNA signatures specific for PCa, miRNA expression profiling of 8 PCa patients, 12 BPH patients and 10 healthy males was carried out using whole genome expression profiling. Differential expression of two individual miRNAs between healthy males and BPH patients was detected and found to possibly target genes related to PCa development and progression. The sensitivity and specificity of miR-1825 for detecting PCa among BPH individuals was found to be 60% and 69%, respectively. Whereas, the sensitivity and specificity of miR-484 were 80% and 19%, respectively. Additionally, the sensitivity and specificity for miR-1825/484 in tandem were 45% and 75%, respectively. The proposed PCa miRNA signatures may therefore be of great value for the accurate diagnosis of PCa and BPH. This exploratory study has identified several possible targets that merit further investigation towards the development and validation of diagnostically useful, non-invasive, urine-based tests that might not only help diagnose PCa but also possibly help differentiate it from BPH.
Resumo:
Nous montrons l’utilisation de la puce exon d’Affymetrix pour l’analyse simultanée de l’expression des gènes et de la variation d’isoformes. Nous avons utilisé les échantillons d’ARN du cerveau et des tissus de référence qui ont été antérieurement utilisés dans l’étude du consortium MicroArray Quality Control (MAQC). Nous démontrons une forte concordance de la quantification de l’expression des gènes entre trois plateformes d’expression populaires à savoir la puce exon d’Affymetrix, la puce Illumina et la puce U133A d’Affymetrix. Plus intéressant nous montrons que la majorité des discordances entre les trois plateformes résulterait des positions différentes des sondes à travers les plateformes et que les variations d’isoforme exactes ne peuvent être identifiées que par la puce exon. Nous avons détecté avec succès, entre les tissus de référence et ceux du cerveau, une centaine de cas d’évènements d’épissage alternatif. La puce exon est requise dans l’analyse de l’épissage alternatif associé aux pathologies telles que les cancers et les troubles neurologiques. Comme application de cette technologie, nous avons analysé les variations d’épissage dans la métastase du cancer de sein développé dans le model de la souris. Nous avons utilisé une gamme bien définie de trois lignées de tumeur mammaire ayant différents potentiels métastatiques. Par des analyses statistiques, nous avons répertorié 2623 transcripts présentant des variations d’expression et d’isoformes entre les types de tumeur. Une analyse du réseau de gènes montre qu’environ la moitié d’entre eux est impliquée dans plusieurs activités cellulaires, ainsi que dans nombreux cancers et désordres génétiques.
Resumo:
Nous présentons ici la description clinique et génétique d’un syndrome neurocutané unique. Le laboratoire du Dr Cossette a entrepris la caractérisation clinique et génétique d'une famille canadienne-française qui a été identifiée par les Drs Giroux et Barbeau en 1972 et qui comprend plus de 100 personnes sur six générations. Les membres atteints de cette famille présentent des lésions typiques d'érythrokératodermie (EK) (OMIM 133190, EKV1 et EKV2), associées à une ataxie spinocérébelleuse pure. Dans cette famille, l'ataxie est caractérisée par des troubles de la coordination et de la démarche causés par une dégénérescence du cervelet et de la moelle épinière. Cette ataxie est transmise selon un mode autosomique dominant. Une étude antérieure de cette variante d'EK avec ataxie avait suggéré une liaison sur le chromosome 1p34-p35, soit la même région que les formes EKV de type 1 et 2, causées respectivement par des mutations dans les gènes connexin-31 (GJB3; OMIM 603324) et connexin-30.3 (GJB4; OMIM 605425). Cependant, aucune mutation n'a été retrouvée dans ces gènes pour la famille canadienne-française. Nous avons récemment recontacté la famille et effectué des examens détaillés, incluant une imagerie par résonance magnétique (IRM) et un électromyogramme (EMG). Les manifestations neurologiques des individus atteints sont compatibles avec une nouvelle forme d’ataxie cérébelleuse pure à transmission autosomique dominante (ADCA de type III dans la classification de Harding) que nous avons appelée SCA34. Une cartographie complète du génome nous a permis de localiser le gène SCA34 sur le chromosome 6p12.3-q16.2. Également, en collaboration avec les Drs Alexis Brice (Hôpital Pitié-La Salpêtrière, Paris) et Alfredo Brusco (Hôpital San Giovanni Battista di Torino, Italie), nous avons confirmé que trois autres familles européennes avec SCA inexpliquée étaient également liées au locus SCA34. Notre laboratoire a récemment entrepris la recherche des mutations responsables de SCA34. Les résultats de ce criblage de gènes candidats sont présentés dans le chapitre 3 de cette thèse.
Resumo:
L’inférence de génomes ancestraux est une étape essentielle pour l’étude de l’évolution des génomes. Connaissant les génomes d’espèces éteintes, on peut proposer des mécanismes biologiques expliquant les divergences entre les génomes des espèces modernes. Diverses méthodes visant à résoudre ce problème existent, se classant parmis deux grandes catégories : les méthodes de distance et les méthodes de synténie. L’état de l’art des distances génomiques ne permettant qu’un certain répertoire de réarrangements pour le moment, les méthodes de synténie sont donc plus appropriées en pratique. Nous proposons une méthode de synténie pour la reconstruction de génomes ancestraux basée sur une définition relaxée d’adjacences de gènes, permettant un contenu en gène inégal dans les génomes modernes causé par des pertes de gènes de même que des duplications de génomes entiers (DGE). Des simulations sont effectuées, démontrant une capacité de former une solution assemblée en un nombre réduit de régions ancestrales contigües par rapport à d’autres méthodes tout en gardant une bonne fiabilité. Des applications sur des données de levures et de plantes céréalières montrent des résultats en accord avec d’autres publications, notamment la présence de fusion imbriquée de chromosomes pendant l’évolution des céréales.
Resumo:
Les cellules T CD4+ humaines sont hétérogènes du point de vue de la permissivité à l’infection par le virus de l’immunodéficience humaine de type 1 (VIH-1). Notre laboratoire a préalablement démontré que les cellules Th1 à phénotype CXCR3+CCR6- sont relativement résistantes à l’infection par le VIH-1 alors que les cellules Th1Th17 à phénotype CXCR3+CCR6+ y sont hautement permissives. La réplication du VIH dépend de plusieurs facteurs cellulaires de restriction ou de permissivité agissant à différentes étapes du cycle viral. Toutefois, malgré plusieurs avancées, la compréhension des voies de signalisation cellulaire impliquées dans la régulation de la réplication du VIH est encore limitée. L’objectif majeur de ce projet de maîtrise est de caractériser les mécanismes moléculaires de la permissivité et de la résistance au VIH respectivement dans les cellules Th1Th17 et Th1. Ce mémoire est divisé en quatre parties qui visent: (i) l’identification des voies canoniques et des fonctions biologiques différemment régulées dans les cellules Th1Th17 versus Th1 par l’analyse de leur transcriptome au niveau du génome entier; (ii) la validation de l’expression différentielle des gènes d’intérêt identifiés par biopuces au niveau des transcrits et des protéines; (iii) la caractérisation du rôle fonctionnel de certains de ces facteurs (i.e., PPARG, AhR) sur la réplication du VIH dans les cellules Th1Th17 versus Th1; et (iv) l’identification du niveau auquel ces facteurs interfèrent avec le cycle de réplication du VIH. Nos résultats d’analyse du transcriptome du génome entier par Gene Set Enrichment Analysis et Ingenuity Pathway Analysis indiquent que les cellules à profil Th1Th17 sont plus susceptibles à l’activation cellulaire et à l’apoptose, favorisent plus l’inflammation et expriment moins fortement les gènes liés à la dégradation protéosomale comparé aux cellules à profil Th1. Ces différences dans la régulation de diverses voies et fonctions biologiques permettent en partie d’expliquer la susceptibilité à l’infection par le VIH dans ces cellules. Nous avons ensuite confirmé l’expression différentielle de certains gènes d’intérêt dans les cellules Th1Th17 (CXCR6, PPARG, ARNTL, CTSH, PTPN13, MAP3K4) versus Th1 (SERPINB6, PTK2) au niveau de l’ARNm et des protéines. Finalement, nous avons démontré le rôle des facteurs de transcription PPARG et AhR dans la régulation de la réplication du VIH. L’activation de la voie PPARG par la rosiglitazone induit la diminution importante de la réplication du VIH dans les cellules T CD4+, alors que l’activation de la voie AhR par les ligands exogènes TCDD et FICZ augmente de façon significative la réplication virale. Nous proposons que la voie PPARG agit comme un régulateur négatif de la réplication du VIH dans ces cellules, en interférant avec la polarisation Th17 et probablement en inhibant l’activité transcriptionnelle du facteur NF-kB. Les rôles des formes nucléaires versus cytoplasmiques du récepteur Ahr semblent être diamétralement opposés, dans la mesure où l’interférence ARN contre AhR s’associe également à l’augmentation de la réplication virale. Il est ainsi possible que la forme cytoplasmique d’AhR, connue par son activité E3 ligase, participe à la dégradation protéosomale des particules virales. Le mécanisme par lequel le AhR nucléaire versus cytoplasmique interfère avec la réplication virale est en cours d’étude au laboratoire. Cette étude représente la première caractérisation de l’expression différentielle de gènes au niveau du génome entier de sous-populations T CD4+ permissives versus résistantes à l’infection par le VIH. Nos résultats identifient de nouvelles cibles moléculaires pour de nouvelles stratégies thérapeutiques visant à limiter la réplication du VIH dans les lymphocytes T CD4+ primaires.
Resumo:
Les facteurs de transcription sont des protéines spécialisées qui jouent un rôle important dans différents processus biologiques tel que la différenciation, le cycle cellulaire et la tumorigenèse. Ils régulent la transcription des gènes en se fixant sur des séquences d’ADN spécifiques (éléments cis-régulateurs). L’identification de ces éléments est une étape cruciale dans la compréhension des réseaux de régulation des gènes. Avec l’avènement des technologies de séquençage à haut débit, l’identification de tout les éléments fonctionnels dans les génomes, incluant gènes et éléments cis-régulateurs a connu une avancée considérable. Alors qu’on est arrivé à estimer le nombre de gènes chez différentes espèces, l’information sur les éléments qui contrôlent et orchestrent la régulation de ces gènes est encore mal définie. Grace aux techniques de ChIP-chip et de ChIP-séquençage il est possible d’identifier toutes les régions du génome qui sont liées par un facteur de transcription d’intérêt. Plusieurs approches computationnelles ont été développées pour prédire les sites fixés par les facteurs de transcription. Ces approches sont classées en deux catégories principales: les algorithmes énumératifs et probabilistes. Toutefois, plusieurs études ont montré que ces approches génèrent des taux élevés de faux négatifs et de faux positifs ce qui rend difficile l’interprétation des résultats et par conséquent leur validation expérimentale. Dans cette thèse, nous avons ciblé deux objectifs. Le premier objectif a été de développer une nouvelle approche pour la découverte des sites de fixation des facteurs de transcription à l’ADN (SAMD-ChIP) adaptée aux données de ChIP-chip et de ChIP-séquençage. Notre approche implémente un algorithme hybride qui combine les deux stratégies énumérative et probabiliste, afin d’exploiter les performances de chacune d’entre elles. Notre approche a montré ses performances, comparée aux outils de découvertes de motifs existants sur des jeux de données simulées et des jeux de données de ChIP-chip et de ChIP-séquençage. SAMD-ChIP présente aussi l’avantage d’exploiter les propriétés de distributions des sites liés par les facteurs de transcription autour du centre des régions liées afin de limiter la prédiction aux motifs qui sont enrichis dans une fenêtre de longueur fixe autour du centre de ces régions. Les facteurs de transcription agissent rarement seuls. Ils forment souvent des complexes pour interagir avec l’ADN pour réguler leurs gènes cibles. Ces interactions impliquent des facteurs de transcription dont les sites de fixation à l’ADN sont localisés proches les uns des autres ou bien médier par des boucles de chromatine. Notre deuxième objectif a été d’exploiter la proximité spatiale des sites liés par les facteurs de transcription dans les régions de ChIP-chip et de ChIP-séquençage pour développer une approche pour la prédiction des motifs composites (motifs composés par deux sites et séparés par un espacement de taille fixe). Nous avons testé ce module pour prédire la co-localisation entre les deux demi-sites ERE qui forment le site ERE, lié par le récepteur des œstrogènes ERα. Ce module a été incorporé à notre outil de découverte de motifs SAMD-ChIP.
Resumo:
La leucémie myéloïde aigüe (LMA) est la forme de leucémie la plus fréquente chez l’adulte au Canada. Bien que de nombreux réarrangements chromosomiques récurrents aient été identifiés chez les patients LMA, près de la moitié des cas présentent un caryotype normal (LMA-CN). L’étude de la LMA-CN in vitro est rendue difficile par le fait que la survie des cellules primaires de patients est défectueuse sur le long terme et que les lignées cellulaires leucémiques ont un caryotype hautement anormal. En 2009, Munker et son équipe ont établi une nouvelle lignée cellulaire, CG-SH, ayant la particularité d’avoir un caryotype normal. L’objectif principal de ce projet d’étude est de caractériser plus en détail ce nouveau modèle d’étude. Nous avons identifié l’ensemble des variants génétiques présents dans CG-SH grâce au séquençage du génome entier. Les variants susceptibles de participer à la leucémogénèse ont été isolés, tels que des insertions détectées dans EZH2 et GATA2, et de nombreux variants faux-sens détectés dans des gènes pertinents pour la LMA. Nous avons montré que les cellules CG-SH sont sensibles à l’effet prolifératif d’une combinaison de cytokines, qui agissent sur le comportement des cellules en modifiant l’expression des gènes associés à la régulation de la prolifération, de l’apoptose et de la différentiation. De plus, les cytokines diminuent le taux de nécrose des cellules en culture sur le court terme. La présente étude a permis d’approfondir notre connaissance sur les caractéristiques moléculaires de la lignée cellulaire CG-SH, un nouveau modèle d’étude in vitro de la LMA-CN.
Resumo:
La duplication est un des évènements évolutifs les plus importants, car elle peut mener à la création de nouvelles fonctions géniques. Durant leur évolution, les génomes sont aussi affectés par des inversions, des translocations (incluant des fusions et fissions de chromosomes), des transpositions et des délétions. L'étude de l'évolution des génomes est importante, notamment pour mieux comprendre les mécanismes biologiques impliqués, les types d'évènements qui sont les plus fréquents et quels étaient les contenus en gènes des espèces ancestrales. Afin d'analyser ces différents aspects de l'évolution des génomes, des algorithmes efficaces doivent être créés pour inférer des génomes ancestraux, des histoires évolutives, des relations d'homologies et pour calculer les distances entre les génomes. Dans cette thèse, quatre projets reliés à l'étude et à l'analyse de l'évolution des génomes sont présentés : 1) Nous proposons deux algorithmes pour résoudre des problèmes reliés à la duplication de génome entier : un qui généralise le problème du genome halving aux pertes de gènes et un qui permet de calculer la double distance avec pertes. 2) Nous présentons une nouvelle méthode pour l'inférence d'histoires évolutives de groupes de gènes orthologues répétés en tandem. 3) Nous proposons une nouvelle approche basée sur la théorie des graphes pour inférer des gènes in-paralogues qui considère simultanément l'information provenant de différentes espèces afin de faire de meilleures prédictions. 4) Nous présentons une étude de l'histoire évolutive des gènes d'ARN de transfert chez 50 souches de Bacillus.
Resumo:
Des études antérieures démontrent que les descendants de peuples européens et africains présentent des différences de susceptibilité à certaines maladies infectieuses. Ces différences suggèrent des variations interpopulationnelles de la réponse immunitaire qui résultent probablement de l’adaptation de ces individus aux pathogènes de leur environnement. Nous avons caractérisé la réponse immunitaire chez des descendants de peuples européens et africains à des infections bactériennes. Nous avons infecté des macrophages dérivés de monocytes de 30 Américains d’origine africaine (Africains) et de 31 Américains d’origine européenne (Européens) avec les pathogènes intracellulaires Listeria monocytogenes et Salmonella typhimurium pendant 4 heures, puis nous avons mesuré le niveau d’expression pangénomique des cellules infectées et non infectées par séquençage de l’ARNm. Nous avons estimé le niveau de contrôle de l’infection par les macrophages à 2, 4 et 24 heures post-infection en évaluant le taux de survie des bactéries. Nous avons observé que les Africains présentent significativement moins de bactéries intracellulaires après 4 et 24 heures que les Européens, suggérant que les Africains contrôlent mieux les infections bactériennes. Nous avons identifié des différences interpopulationnelles dans le niveau de sécrétion des cytokines et dans le niveau d’expression de certains gènes, ce qui suggère que les Africains modulent une réponse inflammatoire plus forte que les Européens. Nous avons démontré que plusieurs de ces gènes ont subi des évènements de sélection positive récents seulement chez les Européens. Notre étude a identifié plusieurs gènes candidats susceptibles d’influencer le cours des infections bactériennes chez les humains. Nos résultats indiquent que les différences dans la progression des maladies infectieuses entre les populations européennes et africaines seraient le résultat de la sélection naturelle.
Resumo:
Les champignons mycorhiziens arbusculaires (CMA) sont très répandus dans le sol où ils forment des associations symbiotiques avec la majorité des plantes appelées mycorhizes arbusculaires. Le développement des CMA dépend fortement de la plante hôte, de telle sorte qu'ils ne peuvent vivre à l'état saprotrophique, par conséquent ils sont considérés comme des biotrophes obligatoires. Les CMA forment une lignée évolutive basale des champignons et ils appartiennent au phylum Glomeromycota. Leurs mycélia sont formés d’un réseau d’hyphes cénocytiques dans lesquelles les noyaux et les organites cellulaires peuvent se déplacer librement d’un compartiment à l’autre. Les CMA permettent à la plante hôte de bénéficier d'une meilleure nutrition minérale, grâce au réseau d'hyphes extraradiculaires, qui s'étend au-delà de la zone du sol explorée par les racines. Ces hyphes possèdent une grande capacité d'absorption d’éléments nutritifs qui vont être transportés par ceux-ci jusqu’aux racines. De ce fait, les CMA améliorent la croissance des plantes tout en les protégeant des stresses biotiques et abiotiques. Malgré l’importance des CMA, leurs génétique et évolution demeurent peu connues. Leurs études sont ardues à cause de leur mode de vie qui empêche leur culture en absence des plantes hôtes. En plus leur diversité génétique intra-isolat des génomes nucléaires, complique d’avantage ces études, en particulier le développement des marqueurs moléculaires pour des études biologiques, écologiques ainsi que les fonctions des CMA. C’est pour ces raisons que les génomes mitochondriaux offrent des opportunités et alternatives intéressantes pour étudier les CMA. En effet, les génomes mitochondriaux (mt) publiés à date, ne montrent pas de polymorphismes génétique intra-isolats. Cependant, des exceptions peuvent exister. Pour aller de l’avant avec la génomique mitochondriale, nous avons besoin de générer beaucoup de données de séquençages de l’ADN mitochondrial (ADNmt) afin d’étudier les méchanismes évolutifs, la génétique des population, l’écologie des communautés et la fonction des CMA. Dans ce contexte, l’objectif de mon projet de doctorat consiste à: 1) étudier l’évolution des génomes mt en utilisant l’approche de la génomique comparative au niveau des espèces proches, des isolats ainsi que des espèces phylogénétiquement éloignées chez les CMA; 2) étudier l’hérédité génétique des génomes mt au sein des isolats de l’espèce modèle Rhizophagus irregularis par le biais des anastomoses ; 3) étudier l’organisation des ADNmt et les gènes mt pour le développement des marqueurs moléculaires pour des études phylogénétiques. Nous avons utilisé l’approche dite ‘whole genome shotgun’ en pyroséquençage 454 et Illumina HiSeq pour séquencer plusieurs taxons de CMA sélectionnés selon leur importance et leur disponibilité. Les assemblages de novo, le séquençage conventionnel Sanger, l’annotation et la génomique comparative ont été réalisés pour caractériser des ADNmt complets. Nous avons découvert plusieurs mécanismes évolutifs intéressant chez l’espèce Gigaspora rosea dans laquelle le génome mt est complètement remanié en comparaison avec Rhizophagus irregularis isolat DAOM 197198. En plus nous avons mis en évidence que deux gènes cox1 et rns sont fragmentés en deux morceaux. Nous avons démontré que les ARN transcrits les deux fragments de cox1 se relient entre eux par épissage en trans ‘Trans-splicing’ à l’aide de l’ARN du gene nad5 I3 qui met ensemble les deux ARN cox1.1 et cox1.2 en formant un ARN complet et fonctionnel. Nous avons aussi trouvé une organisation de l’ADNmt très particulière chez l’espèce Rhizophagus sp. Isolat DAOM 213198 dont le génome mt est constitué par deux chromosomes circulaires. En plus nous avons trouvé une quantité considérable des séquences apparentées aux plasmides ‘plasmid-related sequences’ chez les Glomeraceae par rapport aux Gigasporaceae, contribuant ainsi à une évolution rapide des ADNmt chez les Glomeromycota. Nous avons aussi séquencé plusieurs isolats de l’espèces R. irregularis et Rhizophagus sp. pour décortiquer leur position phylogénéque et inférer des relations évolutives entre celles-ci. La comparaison génomique mt nous montré l’existence de plusieurs éléments mobiles comme : des cadres de lecture ‘open reading frames (mORFs)’, des séquences courtes inversées ‘short inverted repeats (SIRs)’, et des séquences apparentées aux plasimdes ‘plasmid-related sequences (dpo)’ qui impactent l’ordre des gènes mt et permettent le remaniement chromosomiques des ADNmt. Tous ces divers mécanismes évolutifs observés au niveau des isolats, nous permettent de développer des marqueurs moléculaires spécifiques à chaque isolat ou espèce de CMA. Les données générées dans mon projet de doctorat ont permis d’avancer les connaissances fondamentales des génomes mitochondriaux non seulement chez les Glomeromycètes, mais aussi de chez le règne des Fungi et les eucaryotes en général. Les trousses moléculaires développées dans ce projet peuvent servir à des études de la génétique des populations, des échanges génétiques et l’écologie des CMA ce qui va contribuer à la compréhension du rôle primorial des CMA en agriculture et environnement.
Resumo:
Les fichiers accompagnant le document sont en format Microsoft Excel 2010.
Resumo:
Identifying the genetic changes driving adaptive variation in natural populations is key to understanding the origins of biodiversity. The mosaic of mimetic wing patterns in Heliconius butterflies makes an excellent system for exploring adaptive variation using next-generation sequencing. In this study, we use a combination of techniques to annotate the genomic interval modulating red color pattern variation, identify a narrow region responsible for adaptive divergence and convergence in Heliconius wing color patterns, and explore the evolutionary history of these adaptive alleles. We use whole genome resequencing from four hybrid zones between divergent color pattern races of Heliconius erato and two hybrid zones of the co-mimic Heliconius melpomene to examine genetic variation across 2.2 Mb of a partial reference sequence. In the intergenic region near optix, the gene previously shown to be responsible for the complex red pattern variation in Heliconius, population genetic analyses identify a shared 65-kb region of divergence that includes several sites perfectly associated with phenotype within each species. This region likely contains multiple cis-regulatory elements that control discrete expression domains of optix. The parallel signatures of genetic differentiation in H. erato and H. melpomene support a shared genetic architecture between the two distantly related co-mimics; however, phylogenetic analysis suggests mimetic patterns in each species evolved independently. Using a combination of next-generation sequencing analyses, we have refined our understanding of the genetic architecture of wing pattern variation in Heliconius and gained important insights into the evolution of novel adaptive phenotypes in natural populations.