150 resultados para Séquençage d’exome


Relevância:

60.00% 60.00%

Publicador:

Resumo:

L’anémie falciforme est une maladie monogénique causée par une mutation dans le locus de la β-globine. Malgré le fait que l’anémie falciforme soit une maladie monogénique, cette maladie présente une grande hétérogénéité clinique. On présume que des facteurs environnementaux et génétiques contribuent à cette hétérogénéité. Il a été observé qu’un haut taux d’hémoglobine fœtale (HbF) diminuait la sévérité et la mortalité des patients atteints de l’anémie falciforme. Le but de mon projet était d’identifier des variations génétiques modifiant la sévérité clinique de l’anémie falciforme. Dans un premier temps, nous avons effectué la cartographie-fine de trois régions précédemment associées avec le taux d’hémoglobine fœtale. Nous avons ensuite effectué des études d’association pan-génomiques avec deux complications cliniques de l’anémie falciforme ainsi qu’avec le taux d’hémoglobine fœtale. Hormis les régions déjà identifiées comme étant associées au taux d’hémoglobine fœtale, aucun locus n’a atteint le niveau significatif de la puce de génotypage. Pour identifier des groupes de gènes modérément associés au taux d’hémoglobine fœtale qui seraient impliqués dans de mêmes voies biologiques, nous avons effectué une étude des processus biologiques. Finalement, nous avons effectué l’analyse de 19 exomes de patients Jamaïcains ayant des complications cliniques mineures de l’anémie falciforme. Compte tenu de la taille des cohortes de réplication disponibles, nous n’avons pas les moyens de valider statistiquement les variations identifiées par notre étude. Cependant, nos résultats fournissent de bons gènes candidats pour des études fonctionnelles et pour les réplications futures. Nos résultats suggèrent aussi que le β-hydroxybutyrate en concentration endogène pourraient influencer le taux d’hémoglobine fœtale. De plus, nous montrons que la cartographie-fine des régions associées par des études pan-génomiques peut identifier des signaux d’association additionnels et augmenter la variation héritable expliquée par cette région.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

La déficience intellectuelle (DI) définit un groupe de conditions génétiquement hétérogènes caractérisées par l’apparition de troubles cognitifs précoces chez l’enfant. Elle affecte 1-3% de la population dans les pays industrialisés. La prévalence de la DI est beaucoup plus élevée ailleurs dans le monde, en raison de facteurs sociodémographiques comme le manque de ressources dans le système de santé, la pauvreté et la consanguinité. Des facteurs non-génétiques sont mis en cause dans l’étiologie de la DI ; on estime qu’environ 25% des cas de DI sont d’origine génétique. Traditionnellement, les bases moléculaires de la DI ont été investiguées par des analyses cytogénétiques, les approches de cartographie génétique et le séquençage de gènes candidats ; ces techniques de génétiques classiques sont encore mises à rude épreuve dans l’analyse de maladies complexes comme la DI. La DI liée à l’X a été particulièrement étudiée, avec plus d’une centaine de gènes identifiés uniquement sur le chromosome X. Des mutations hétérozygotes composites sont mises en évidence dans la DI autosomique, dans le contexte d’unions non-consanguines. L’occurrence de ce type de mutations est rare, chez des individus non-apparentés, de sorte que les mutations dominantes de novo sont plus courantes. Des mutations homozygotes sont attendues dans les populations consanguines ou marquées par un effet fondateur. En fait, les bases moléculaires de la DI autosomique ont été presqu’exclusivement étudiées dans le contexte de populations avec des forts taux de consanguinité. L’origine de la DI demeure encore inconnue dans environ 60 % des cas diagnostiqués. En l’absence de facteurs environnementaux associés à la DI chez ces individus, il est possible d’envisager que des facteurs génétiques non identifiés entrent en jeu dans ces cas de DI inexpliqués. Dans ce projet de recherche, nous voulions explorer l’origine génétique de la DI, dans vingt familles, où une transmission de la maladie selon un mode autosomique récessif est suspectée. Nous avons mis de l’avant les techniques de séquençage de nouvelle génération, afin de mettre en évidence les déterminants génétiques de la DI, à l’échelle du génome humain. En fait, nous avons priorisé la capture et le séquençage de l’exome; soient la totalité des régions codantes du génome humain et leurs sites d’épissage flanquants. Dans nos analyses, nous avons ciblé les variants qui ne sont pas rapportés trop fréquemment dans différentes bases de données d’individus contrôles, ces mutations rares cadrent mieux avec une condition comme la DI. Nous avons porté une attention particulière aux mutations autosomiques récessives (homozygotes et hétérozygotes composites) ; nous avons confirmé que ces mutations ségréguent avec une transmission récessive dans la famille à l’étude. Nous avons identifié des mutations dans des gènes pouvant être à l’origine de la DI, dans certaines des familles analysées ; nous avons validé biologiquement l'impact fonctionnel des mutations dans ces gènes candidats, afin de confirmer leur implication dans la pathophysiologie de la DI. Nous avons élucidé les bases moléculaires de la DI dans huit des familles analysées. Nous avons identifié le second cas de patients avec syndrome de cassure chromosomique de Varsovie, caractérisé par des dysfonctions de l’ARN hélicase DDX11. Nous avons montré qu’une perte de l’activité de TBC1D7, une des sous-unités régulatrice du complexe TSC1-TSC2, est à l’origine de la pathologie dans une famille avec DI et mégalencéphalie. Nous avons mis en évidence des mutations pathogéniques dans le gène ASNS, codant pour l’Asparagine synthétase, chez des patients présentant une microcéphalie congénitale et une forme progressive d’encéphalopathie. Nous avons montré que des dysfonctions dans la protéine mitochondriale MAGMAS sont mises en cause dans une condition caractérisée par un retard prononcé dans le développement associé à une forme sévère de dysplasie squelettique. Nous avons identifié une mutation tronquant dans SPTBN2, codant pour la protéine spinocerebellar ataxia 5, dans une famille avec DI et ataxie cérébelleuse. Nous avons également mis en évidence une mutation dans PIGN, un gène impliqué dans la voie de biosynthèse des ancres de glycosylphosphatidylinositol , pouvant être à l’origine de la maladie chez des individus avec épilepsie et hypotonie. Par ailleurs, nous avons identifié une mutation - perte de fonction dans CLPB, codant pour une protéine chaperonne mitochondriale, dans une famille avec encéphalopathie néonatale, hyperekplexie et acidurie 3-méthylglutaconique. Le potentiel diagnostic des techniques de séquençage de nouvelle génération est indéniable ; ces technologies vont révolutionner l’univers de la génétique moléculaire, en permettant d’explorer les bases génétiques des maladies complexes comme la DI.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Les glycogénoses sont des maladies touchant la synthèse ou la dégradation du glycogène. Un diagnostic précoce et une diète optimale, incluant la prévention des hypoglycémies, sont d’une importante cruciale pour le devenir des patients. Les présents travaux visaient la confirmation génétique de glycogénose chez des patients inuits du Nunavik ainsi que l’évaluation de l’impact sur le sommeil et la qualité de vie d’une nouvelle thérapie nutritionnelle, GlycosadeTM, dans une cohorte de patients montréalaise. Par séquençage d’exome, nous avons identifié la mutation causale de glycogénose au Nunavik, permettant un diagnostic précoce et un dépistage des membres de la famille. Nous avons aussi introduit une fécule de maïs à action prolongée et évalué prospectivement le sommeil et la qualité de vie des patients avec glycogénose avant et après ce traitement. Nous avons mis en évidence des troubles de sommeil chez les patients et avons discuté du GlycosadeTM comme d’une option thérapeutique prometteuse.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Les encéphalopathies épileptogènes sont des maladies graves de l’enfance associant une épilepsie, souvent réfractaire, et un retard de développement. Les mécanismes sous-tendant ces maladies sont peu connus. Cependant, nous postulons que ces épilepsies puissent être causées par une dysfonction du réseau inhibiteur. En effet, des défauts de migration ou de maturation des interneurones GABAergiques (INs) corticaux induisent l’épilepsie, tant chez l’humain que chez la souris. Dans le but d’étudier les causes génétiques des encéphalopathies épileptogènes sporadiques inexpliquées, le laboratoire de la Dre Rossignol a procédé au séquençage d’exome entier d’une cohorte d’enfants atteints. Cela a permis d’identifier, chez un patient, une nouvelle mutation de novo, possiblement pathogène, dans le gène MYO9b. MYO9b est impliqué dans la migration de cellules immunitaires et cancéreuses et est exprimée durant le développement cérébral. Nous émettons l’hypothèse voulant que MYO9b puisse être importante pour la migration des INs corticaux. Les résultats présentés dans ce mémoire démontrent que Myo9b est exprimé dès le stade embryonnaire par les progéniteurs des INs corticaux et que son expression se restreint aux INs dans le cortex mature. De plus, nous démontrons que la répression ex vivo de Myo9b sélectivement dans les INs au sein de tranches corticales organotypiques embryonnaires mène à des défauts morphologiques majeurs de ces cellules en migration. En effet, ces cellules présentent une morphologie multipolaire et des neurites rostraux plus longs et plus complexes. Ces changements morphologiques pourraient avoir un impact majeur sur la migration des INs et ainsi perturber le développement des réseaux inhibiteurs.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Les encéphalopathies épileptogènes sont des maladies graves de l’enfance associant une épilepsie, souvent réfractaire, et un retard de développement. Les mécanismes sous-tendant ces maladies sont peu connus. Cependant, nous postulons que ces épilepsies puissent être causées par une dysfonction du réseau inhibiteur. En effet, des défauts de migration ou de maturation des interneurones GABAergiques (INs) corticaux induisent l’épilepsie, tant chez l’humain que chez la souris. Dans le but d’étudier les causes génétiques des encéphalopathies épileptogènes sporadiques inexpliquées, le laboratoire de la Dre Rossignol a procédé au séquençage d’exome entier d’une cohorte d’enfants atteints. Cela a permis d’identifier, chez un patient, une nouvelle mutation de novo, possiblement pathogène, dans le gène MYO9b. MYO9b est impliqué dans la migration de cellules immunitaires et cancéreuses et est exprimée durant le développement cérébral. Nous émettons l’hypothèse voulant que MYO9b puisse être importante pour la migration des INs corticaux. Les résultats présentés dans ce mémoire démontrent que Myo9b est exprimé dès le stade embryonnaire par les progéniteurs des INs corticaux et que son expression se restreint aux INs dans le cortex mature. De plus, nous démontrons que la répression ex vivo de Myo9b sélectivement dans les INs au sein de tranches corticales organotypiques embryonnaires mène à des défauts morphologiques majeurs de ces cellules en migration. En effet, ces cellules présentent une morphologie multipolaire et des neurites rostraux plus longs et plus complexes. Ces changements morphologiques pourraient avoir un impact majeur sur la migration des INs et ainsi perturber le développement des réseaux inhibiteurs.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

La rétinite pigmentaire (RP) et l'amaurose congénitale de Leber (LCA) sont deux maladies héréditaires classées dans le groupe des rétinopathies pigmentaires. Plus de 100 gènes ou loci ont étés identifiés dans les RP (comptant pour 60% des patients) et 14 gènes pour les LCA (responsables de 70% des cas). A elles-deux et en ne prenant que les plus fréquentes, ces maladies représentent 948 exons à analyser lorsqu'on recherche une mutation chez un patient. La recherche de mutations au moyen du séquençage génomique classique (séquençage selon Sanger) de tous les gènes de ces deux maladies implique des délais d'analyse importants et des coûts très élevés. La méthode de séquençage à haut débit (avec le séquenceur Roche GS Junior) permet grâce à une puce à ADN le séquençage simultané des 948 exons. Le but de mon travail de Master est de comparer ces deux approches afin de déterminer celle qui est la plus économique et la plus efficiente en temps. Pour cela, j'ai d'abord établi la liste de tous les gènes impliqués dans les RP et LCA, puis identifié tous les exons ainsi que les promoteurs et séquences 3' non traduites. J'ai ensuite calculé le coût théorique d'une analyse de tous les gènes avec chacune des méthodes. J'ai également estimé les coûts à facturer à l'assurance concernant le séquençage à haut débit sur la base des coûts facturables à l'assurance de la méthode Sanger et des bénéfices du laboratoire. Le séquençage des 948 exons par le séquençage à haut débit (avec le GS Junior) représente la technique de séquençage la plus économique et la plus efficiente en temps et constitue donc la méthode de choix dans le screening diagnostic des gènes impliqués dans les RP et LCA. Cette méthode est plus rapide, les réactifs et la machine sont moins coûteux et la laborantine peut analyser un nombre plus important d'exons en un temps moindre, donc elle coûtera moins cher au laboratoire. Cette méthode est donc d'un grand intérêt pour les patients, les assurances et le laboratoire. Cette nouvelle technique de séquençage soulève de nouvelles interrogations telles que la décision de savoir quelle information doit être donnée aux médecins, aux assurances et aux patients. Interrogations auxquelles il devient de plus en plus pressant de répondre.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Les facteurs de transcription sont des protéines spécialisées qui jouent un rôle important dans différents processus biologiques tel que la différenciation, le cycle cellulaire et la tumorigenèse. Ils régulent la transcription des gènes en se fixant sur des séquences d’ADN spécifiques (éléments cis-régulateurs). L’identification de ces éléments est une étape cruciale dans la compréhension des réseaux de régulation des gènes. Avec l’avènement des technologies de séquençage à haut débit, l’identification de tout les éléments fonctionnels dans les génomes, incluant gènes et éléments cis-régulateurs a connu une avancée considérable. Alors qu’on est arrivé à estimer le nombre de gènes chez différentes espèces, l’information sur les éléments qui contrôlent et orchestrent la régulation de ces gènes est encore mal définie. Grace aux techniques de ChIP-chip et de ChIP-séquençage il est possible d’identifier toutes les régions du génome qui sont liées par un facteur de transcription d’intérêt. Plusieurs approches computationnelles ont été développées pour prédire les sites fixés par les facteurs de transcription. Ces approches sont classées en deux catégories principales: les algorithmes énumératifs et probabilistes. Toutefois, plusieurs études ont montré que ces approches génèrent des taux élevés de faux négatifs et de faux positifs ce qui rend difficile l’interprétation des résultats et par conséquent leur validation expérimentale. Dans cette thèse, nous avons ciblé deux objectifs. Le premier objectif a été de développer une nouvelle approche pour la découverte des sites de fixation des facteurs de transcription à l’ADN (SAMD-ChIP) adaptée aux données de ChIP-chip et de ChIP-séquençage. Notre approche implémente un algorithme hybride qui combine les deux stratégies énumérative et probabiliste, afin d’exploiter les performances de chacune d’entre elles. Notre approche a montré ses performances, comparée aux outils de découvertes de motifs existants sur des jeux de données simulées et des jeux de données de ChIP-chip et de ChIP-séquençage. SAMD-ChIP présente aussi l’avantage d’exploiter les propriétés de distributions des sites liés par les facteurs de transcription autour du centre des régions liées afin de limiter la prédiction aux motifs qui sont enrichis dans une fenêtre de longueur fixe autour du centre de ces régions. Les facteurs de transcription agissent rarement seuls. Ils forment souvent des complexes pour interagir avec l’ADN pour réguler leurs gènes cibles. Ces interactions impliquent des facteurs de transcription dont les sites de fixation à l’ADN sont localisés proches les uns des autres ou bien médier par des boucles de chromatine. Notre deuxième objectif a été d’exploiter la proximité spatiale des sites liés par les facteurs de transcription dans les régions de ChIP-chip et de ChIP-séquençage pour développer une approche pour la prédiction des motifs composites (motifs composés par deux sites et séparés par un espacement de taille fixe). Nous avons testé ce module pour prédire la co-localisation entre les deux demi-sites ERE qui forment le site ERE, lié par le récepteur des œstrogènes ERα. Ce module a été incorporé à notre outil de découverte de motifs SAMD-ChIP.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Le syndrome du QT long congénital (LQTS) est une canalopathie génétique, à l’origine de syncopes et mort subite. Le dépistage génétique identifie des variantes génétiques dans 50-70% des cas, suggérant l’implication d’autres gènes. Nous avons recueilli les caractéristiques des patients avec un LQTS à l’ICM, et recruté 12 patients avec un génotype négatif pour le LQTS pour un séquençage à haut débit des exons afin d’identifier de nouvelles variantes causales. Nous avons développé une approche analytique par étapes : (1) les gènes connus du, (2) les gènes dans des loci identifiés par des études d’association sur le QT, et (3) les gènes montrant la même variante chez plusieurs patients. L’analyse génétique a identifié de nouvelles variantes dans: (1) KCNJ2, ANK2 et AKAP9, et (2) dans NOS1AP. (3) Deux patientes avec des phénotypes semblables présentent la même variante homozygote dans TECRL, un nouveau gène candidat dont le rôle est inconnu.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Les positions des évènements de recombinaison s’agrègent ensemble, formant des hotspots déterminés en partie par la protéine à évolution rapide PRDM9. En particulier, ces positions de hotspots sont déterminées par le domaine de doigts de zinc (ZnF) de PRDM9 qui reconnait certains motifs d’ADN. Les allèles de PRDM9 contenant le ZnF de type k ont été préalablement associés avec une cohorte de patients affectés par la leucémie aigüe lymphoblastique. Les allèles de PRDM9 sont difficiles à identifier à partir de données de séquençage de nouvelle génération (NGS), en raison de leur nature répétitive. Dans ce projet, nous proposons une méthode permettant la caractérisation d’allèles de PRDM9 à partir de données de NGS, qui identifie le nombre d’allèles contenant un type spécifique de ZnF. Cette méthode est basée sur la corrélation entre les profils représentant le nombre de séquences nucléotidiques uniques à chaque ZnF retrouvés chez les lectures de NGS simulées sans erreur d’une paire d’allèles et chez les lectures d’un échantillon. La validité des prédictions obtenues par notre méthode est confirmée grâce à analyse basée sur les simulations. Nous confirmons également que la méthode peut correctement identifier le génotype d’allèles de PRDM9 qui n’ont pas encore été identifiés. Nous conduisons une analyse préliminaire identifiant le génotype des allèles de PRDM9 contenant un certain type de ZnF dans une cohorte de patients atteints de glioblastomes multiforme pédiatrique, un cancer du cerveau caractérisé par les mutations récurrentes dans le gène codant pour l’histone H3, la cible de l’activité épigénétique de PRDM9. Cette méthode ouvre la possibilité d’identifier des associations entre certains allèles de PRDM9 et d’autres types de cancers pédiatriques, via l’utilisation de bases de données de NGS de cellules tumorales.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Résumé Le transfert du phosphate des racines vers les feuilles s'effectue par la voie du xylème. Il a été précédemment démontré que la protéine AtPHO1 était indispensable au transfert du phosphate dans les vaisseaux du xylème des racines chez la plante modèle Arabidopsis thaliana. Le séquençage et l'annotation du génome d'Arabidopsis ont permis d'identifier dix séquences présentant un niveau de similarité significatif avec le gène AtPHO1 et constituant une nouvelle famille de gène appelé la famille de AtPHO1. Basée sur une étude moléculaire et génétique, cette thèse apporte des éléments de réponse pour déterminer le rôle des membres de ia famille de AtPHO1 chez Arabidopsis, inconnue à ce jour. Dans un premier temps, une analyse bioinformatique des séquences protéiques des membres de la famille de AtPHO1 a révélé la présence dans leur région N-terminale d'un domaine nommé SPX. Ce dernier est conservé parmi de nombreuses protéines impliquées dans l'homéostasie du phosphate chez la levure, renforçant ainsi l'hypothèse que les membres de la famille de AtPHO1 auraient comme AtPHO1 un rôle dans l'équilibre du phosphate dans la plante. En parallèle, la localisation tissulaire de l'expression des gènes AtPHO dans Arabidopsis a été identifiée par l'analyse de plantes transgéniques exprimant le gène rapporteur uidA sous le contrôle des promoteurs respectifs des gènes AtPHO. Un profil d'expression de chaque gène AtPHO au cours du développement de la plante a été obtenu. Une expression prédominante au niveau des tissus vasculaires des racines, des feuilles, des tiges et des fleurs a été observée, suggérant que les gènes AtPHO pourraient avoir des fonctions redondantes au niveau du transfert de phosphate dans le cylindre vasculaire de ces différents organes. Toutefois, plusieurs régions promotrices des gènes AtPHO contrôlent également un profil d'expression GUS non-vasculaire, indiquant un rôle putatif des gènes AtPHO dans l'acquisition ou le recyclage de phosphate dans la plante. Dans un deuxième temps, l'analyse de l'expression des gènes AtPHO durant une carence en phosphate a établi que seule l'expression des gènes AtPHO1, AtPHO1; H1 et AtPHO1; H10 est régulée par cette carence. Une étude approfondie de leur expression en réponse à des traitements affectant l'homéostasie du phosphate dans la plante a ensuite démontré leur régulation par différentes voies de signalisation. Ensuite, une analyse détaillée de la régulation de l'expression du gène AtPHO1; H1O dans des feuilles d'Arabidopsis blessées ou déshydratées a révélé que ce gène constitue le premìer gène marqueur d'une nouvelle voie de signalisation induite par l'OPDA, pas par le JA et dépendante de la protéine COI1. Ces résultats démontrent pour la première fois que l'OPDA et le JA peuvent activer différents gènes via des voies de signalisation dépendantes de COI1. Enfin, cette thèse révèle l'identification d'un nouveau rôle de la protéine AtPHO1 dans la régulation de l'action de l'ABA au cours des processus de fermeture stomatique et de germination des graines chez Arabidopsis. Bien que les fonctions exactes des protéines AtPHO restent à être déterminées, ce travail de thèse suggère leur implication dans la propagation de différents signaux dans la plante via la modulation du potentiel membranaire et/ou l'affectation de la composition en ions des cellules comme le font de nombreux transporteurs ou régulateur du transport d'ions. Summary Phosphate is transferred from the roots to the shoot via the xylem. The requirement for AtPHO1 protein to transfer phosphate to the xylem vessels of the root has been previously demonstrated in Arabidopsis thaliana. The sequencing and the annotation of the Arabidopsis genome had allowed the identification of ten sequences that show a significant level of similarity with the AtPHO1 gene. These 10 genes, of unknown functions, constitute a new gene family called the AtPHO1 gene family. Based on a molecular and genetics study, this thesis reveals some information needed to understand the role of the AtPHO1 family members in the plant Arabidopsis. First, a bioinformatics study revealed that the AtPHO sequences contained, in the N-terminal hydrophilic region, a motif called SPX and conserved among multiple proteins involved in phosphate homeostasis in yeast. This finding reinforces the hypothesis that all AtPHO1 family members have, as AtPHO1, a role in phosphate homeostasis. In parallel, we identified the pattern of expression of AtPHO genes in Arabidopsis via analysis of transgenic plants expressing the uidA reporter gene under the control of respective AtPHO promoter regions. The results exhibit a predominant expression of AtPHO genes in vascular tissues of all organs of the plant, implying that these AtPHO genes could have redundant functions in the transfer of phosphate to the vascular cylinder of various organs. The GUS expression pattern for several AtPHO promoter regions was also detected in non-vascular tissue indicating a broad role of AtPHO genes in the acquisition or in the recycling of phosphate in the plant. In a second step, the analysis of the expression of AtPHO genes during phosphate starvation established that only the expression of the AtPHO1, AtPHO1; H1 and AtPHO1; H10 genes were regulated by Pi starvation. Interestingly, different signalling pathways appeared to regulate these three genes during various treatments affecting Pi homeostasis in the plant. The third chapter presents a detailed analysis of the signalling pathways regulating the expression of the AtPHO1; H10 gene in Arabidopsis leaves during wound and dehydrated stresses. Surprisingly, the expression of AtPHO1; H10 was found to be regulated by OPDA (the precursor of JA) but not by JA itself and via the COI1 protein (the central regulator of the JA signalling pathway). These results demonstrated for the first time that OPDA and JA could activate distinct genes via COI1-dependent pathways. Finally, this thesis presents the identification of a novel role of the AtPHO1 protein in the regulation of ABA action in Arabidopsis guard cells and during seed germination. Although the exact role and function of AtPHO1 still need to be determined, these last findings suggest that AtPHO1 and by extension other AtPHO proteins could mediate the propagation of various signals in the plant by modulating the membrane potential and/or by affecting cellular ion composition, as it is the case for many ion transporters or regulators of ion transport.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

La recherche biomédicale profite de plus en plus au développement des techniques de séquençage et d'analyse de l'ADN. Les coûts du séquençage ont drastiquement baissés au cours de ces dernières années et les genomes-wides associations studies (GWAS) ont révolutionné l'approche de la recherche génétique en mettant en évidence associations et single-nucleotide-polymorphisms (SNPs) qui pourraient être importantes pour la susceptibilité à développer des maladies dites communes. La majorité des cancers appartiennent à cette définition de maladie commune, ils sont généralement causés par une accumulation de lésions/mutations de l'ADN aboutissant à une perte de contrôle de la prolifération et du cycle cellulaire. Ces mutations peuvent être héréditaires, acquises ou une combinaison des deux. Dans la plupart des cancers communs (cancers qui n'ont pas une hérédité familiale importante) les mutations de l'ADN sont souvent amenées par des facteurs tels que inflammation chronique, tabac, virus, exposition aux radiations, aux agents chimiques. Ceci est le cas pour le mélanome également, un cancer de la peau qui est corrélé à l'exposition des rayons UV solaires ou artificiels. Une hypothèse largement acceptée aujourd'hui est que les tumeurs, à travers leur accumulation progressive de mutations somatiques et d'anomalies chromosomiques, finissent par échapper au contrôle exercé par le système immunitaire. Il est par conséquence imaginable que des polymorphismes naturels puissent renforcer ou affaiblir la capacité du système immunitaire à freiner voir arrêter la progression tumorale.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

SUMMARY : Eukaryotic DNA interacts with the nuclear proteins using non-covalent ionic interactions. Proteins can recognize specific nucleotide sequences based on the sterical interactions with the DNA and these specific protein-DNA interactions are the basis for many nuclear processes, e.g. gene transcription, chromosomal replication, and recombination. New technology termed ChIP-Seq has been recently developed for the analysis of protein-DNA interactions on a whole genome scale and it is based on immunoprecipitation of chromatin and high-throughput DNA sequencing procedure. ChIP-Seq is a novel technique with a great potential to replace older techniques for mapping of protein-DNA interactions. In this thesis, we bring some new insights into the ChIP-Seq data analysis. First, we point out to some common and so far unknown artifacts of the method. Sequence tag distribution in the genome does not follow uniform distribution and we have found extreme hot-spots of tag accumulation over specific loci in the human and mouse genomes. These artifactual sequence tags accumulations will create false peaks in every ChIP-Seq dataset and we propose different filtering methods to reduce the number of false positives. Next, we propose random sampling as a powerful analytical tool in the ChIP-Seq data analysis that could be used to infer biological knowledge from the massive ChIP-Seq datasets. We created unbiased random sampling algorithm and we used this methodology to reveal some of the important biological properties of Nuclear Factor I DNA binding proteins. Finally, by analyzing the ChIP-Seq data in detail, we revealed that Nuclear Factor I transcription factors mainly act as activators of transcription, and that they are associated with specific chromatin modifications that are markers of open chromatin. We speculate that NFI factors only interact with the DNA wrapped around the nucleosome. We also found multiple loci that indicate possible chromatin barrier activity of NFI proteins, which could suggest the use of NFI binding sequences as chromatin insulators in biotechnology applications. RESUME : L'ADN des eucaryotes interagit avec les protéines nucléaires par des interactions noncovalentes ioniques. Les protéines peuvent reconnaître les séquences nucléotidiques spécifiques basées sur l'interaction stérique avec l'ADN, et des interactions spécifiques contrôlent de nombreux processus nucléaire, p.ex. transcription du gène, la réplication chromosomique, et la recombinaison. Une nouvelle technologie appelée ChIP-Seq a été récemment développée pour l'analyse des interactions protéine-ADN à l'échelle du génome entier et cette approche est basée sur l'immuno-précipitation de la chromatine et sur la procédure de séquençage de l'ADN à haut débit. La nouvelle approche ChIP-Seq a donc un fort potentiel pour remplacer les anciennes techniques de cartographie des interactions protéine-ADN. Dans cette thèse, nous apportons de nouvelles perspectives dans l'analyse des données ChIP-Seq. Tout d'abord, nous avons identifié des artefacts très communs associés à cette méthode qui étaient jusqu'à présent insoupçonnés. La distribution des séquences dans le génome ne suit pas une distribution uniforme et nous avons constaté des positions extrêmes d'accumulation de séquence à des régions spécifiques, des génomes humains et de la souris. Ces accumulations des séquences artéfactuelles créera de faux pics dans toutes les données ChIP-Seq, et nous proposons différentes méthodes de filtrage pour réduire le nombre de faux positifs. Ensuite, nous proposons un nouvel échantillonnage aléatoire comme un outil puissant d'analyse des données ChIP-Seq, ce qui pourraient augmenter l'acquisition de connaissances biologiques à partir des données ChIP-Seq. Nous avons créé un algorithme d'échantillonnage aléatoire et nous avons utilisé cette méthode pour révéler certaines des propriétés biologiques importantes de protéines liant à l'ADN nommés Facteur Nucléaire I (NFI). Enfin, en analysant en détail les données de ChIP-Seq pour la famille de facteurs de transcription nommés Facteur Nucléaire I, nous avons révélé que ces protéines agissent principalement comme des activateurs de transcription, et qu'elles sont associées à des modifications de la chromatine spécifiques qui sont des marqueurs de la chromatine ouverte. Nous pensons que lés facteurs NFI interagir uniquement avec l'ADN enroulé autour du nucléosome. Nous avons également constaté plusieurs régions génomiques qui indiquent une éventuelle activité de barrière chromatinienne des protéines NFI, ce qui pourrait suggérer l'utilisation de séquences de liaison NFI comme séquences isolatrices dans des applications de la biotechnologie.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

2 Abstract2.1 En françaisLe séquençage du génome humain est un pré-requis fondamental à la compréhension de la biologie de l'être humain. Ce projet achevé, les scientifiques ont dû faire face à une tâche aussi importante, comprendre cette suite de 3 milliards de lettres qui compose notre génome. Le consortium ENCODE (ENCyclopedia Of Dna Elements) fût formé comme une suite logique au projet du génome humain. Son rôle est d'identifier tous les éléments fonctionnels de notre génome incluant les régions transcrites, les sites d'attachement des facteurs de transcription, les sites hypersensibles à la DNAse I ainsi que les marqueurs de modification des histones. Dans le cadre de ma thèse doctorale, j'ai participé à 2 sous-projets d'ENCODE. En premier lieu, j'ai eu la tâche de développer et d'optimiser une technique de validation expérimentale à haut rendement de modèles de gènes qui m'a permis d'estimer la qualité de la plus récente annotation manuelle. Ce nouveau processus de validation est bien plus efficace que la technique RNAseq qui est actuellement en train de devenir la norme. Cette technique basée sur la RT-PCR, m'a notamment permis de découvrir de nouveaux exons dans 10% des régions interrogées. En second lieu j'ai participé à une étude ayant pour but d'identifier les extrémités de tous les gènes des chromosomes humains 21 et 22. Cette étude à permis l'identification à large échelle de transcrits chimères comportant des séquences provenant de deux gènes distincts pouvant être à une grande distance l'un de autre.2.2 In EnglishThe completion of the human genome sequence js the prerequisite to fully understand the biology of human beings. This project achieved, scientists had to face another challenging task, understanding the meaning of the 3 billion letters composing this genome. As a logical continuation of the human genome project, the ENCODE (ENCyclopedia Of DNA Elements) consortium was formed with the aim of annotating all its functional elements. These elements include transcribed regions, transcription binding sites, DNAse I hypersensitive sites and histone modification marks. In the frame of my PhD thesis, I was involved in two sub-projects of ENCODE. Firstly I developed and optimized an high throughput method to validate gene models, which allowed me to assess the quality of the most recent manually-curated annotation. This novel experimental validation pipeline is extremely effective, far more so than transcriptome profiling through RNA sequencing, which is becoming the norm. This RT-PCR-seq targeted-approach is likewise particularly efficient in identifying novel exons, as we discovered about 10% of loci with unannotated exons. Secondly, I participated to a study aiming to identify the gene boundaries of all genes in the human chromosome 21 and 22. This study led to the identification of chimeric transcripts that are composed of sequences coming form two distinct genes that can be map far away from each other.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

AbstractThe Chlamydiales order is an important bacterial phylum that comprises some of the most successful human pathogens such as Chlamydia trachomatis, the leading infectious cause of blindness worldwide. Since some years, several new bacteria related to Chlamydia have been discovered in clinical or environmental samples and might represent emerging pathogens. The genome sequencing of classical Chlamydia has brought invaluable information on these obligate intracellular bacteria otherwise difficult to study due to the lack of tools to perform basic genetic manipulation. The recent emergence of high-throughput sequencing technologies yielding millions of reads in a short time lowered the costs of genome sequencing and thus represented a unique opportunity to study Chlamydia-re\ated bacteria. Based on the sequencing and the analysis of Chlamydiales genomes, this thesis provides significant insights into the genetic determinants of the intracellular lifestyle, the pathogenicity, the metabolism and the evolution of Chlamydia-related bacteria. A first approach showed the efficacy of rapid sequencing coupled to proteomics to identify immunogenic proteins. This method, particularly useful for an emerging pathogen such as Parachlamydia acanthamoebae, enabled us to discover good candidates for the development of diagnostic tools that would permit to evaluate at larger scale the role of this bacterium in disease. Second, the complete genome of Waddlia chondrophila, a potential agent of miscarriage, encodes numerous virulence factors to manipulate its host cell and resist to environmental stresses. The reconstruction of metabolic pathways showed that the bacterium possesses extensive capabilities compared to related organisms. However, it is still incapable of synthesizing some essential components and thus has to import them from its host. Third, the genome comparison of Protochlamydia naegleriophila to its closest known relative Protochlamydia amoebophila revealed a particular evolutionary dynamic with the occurrence of an unexpected genome rearrangement. Fourth, a phylogenetic analysis of P. acanthamoebae and Legionella drancourtii identified several genes probably exchanged by horizontal gene transfer with other intracellular bacteria that might occur within their amoebal host. These genes often encode mechanisms for resistance to metal or toxic compounds. As a whole, the analysis of the different genomes enabled us to highlight a large diversity in size, GC percentage, repeat content as well as plasmid organization. The abundant genomic data obtained during this thesis have a wide impact since they provide the necessary bases for detailed investigations on countless aspects of the biology and the evolution of Chlamydia-related bacteria, whether in wet lab or by bioinformatical analyses.RésuméL'ordre des Chlamydiales est un important phylum bactérien qui comprend de nombreuses espèces pathogènes pour l'homme et les animaux, dont Chlamydia trachomatis, responsable du trachome, la cause majeure de cécité d'origine infectieuse à travers le monde. Durant ces dernières décennies, de nombreuses bactéries apparentées aux Chlamydia ont été découvertes dans des échantillons environnementaux ou cliniques mais leur éventuel rôle pathogène dans le développement de maladies reste peu connu. Ces bactéries sont des intracellulaires obligatoires car elles ont besoin d'une cellule hôte pour se multiplier, ce qui rend leur étude particulièrement difficile. Le développement de nouvelles technologies permettant de séquencer le génome d'un organisme rapidement et à moindre coût ainsi que l'essor des méthodes d'analyse s'y rapportant représentent une opportunité exceptionnelle d'étudier ces organismes. Dans ce contexte, cette thèse démontre l'utilité de la génomique pour développer de nouveaux outils diagnostiques ainsi que pour étudier le métabolisme de ces bactéries, leurs facteurs de virulence et leur évolution.Ainsi, une première approche a illustré l'utilité d'un séquençage rapide pour obtenir les informations nécessaires à l'identification de protéines qui sont reconnues par des anticorps humains ou animaux. Cette méthode, particulièrement utile pour un pathogène émergent tel que Parachlamydia acanthamoebae, a permis de découvrir de bons candidats pour le développement d'un outil diagnostique qui permettrait d'évaluer à plus large échelle le rôle de cette bactérie notamment dans la pneumonie. L'analyse du contenu génique de Waddlia chondrophila, un autre germe qui pourrait être impliqué dans les avortements et tes fausses-couches, a en outre mis en évidence la présence de nombreux facteurs connus qui lui permettent de manipuler son hôte. Cette bactérie possède de plus grandes capacités métaboliques que les autres Chlamydia, mais elle est incapable de synthétiser certains composants et doit donc les importer de son hôte pour subvenir à ses besoins. La comparaison du génome de Protochlamydia naegleriophila à son plus proche parent, Protochlamydia amoebophila, a dévoilé une évolution dynamique particulière avec l'occurrence d'un réarrangement majeur inattendu après la séparation de ces deux espèces. En outre, ces études ont montré l'occurrence de plusieurs transferts de gène avec d'autres organismes plus éloignés, notamment d'autres intracellulaires d'amibes, souvent pour l'acquisition de mécanismes de résistances à des composés toxiques. Les données génomiques acquises durant ce travail posent les fondements nécessaires a de nombreuses analyses qui permettront progressivement de mieux comprendre de nombreux aspects de ces bactéries fascinantes.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Recently, the introduction of second generation sequencing and further advance-ments in confocal microscopy have enabled system-level studies for the functional characterization of genes. The degree of complexity intrinsic to these approaches needs the development of bioinformatics methodologies and computational models for extracting meaningful biological knowledge from the enormous amount of experi¬mental data which is continuously generated. This PhD thesis presents several novel bioinformatics methods and computational models to address specific biological questions in Plant Biology by using the plant Arabidopsis thaliana as a model system. First, a spatio-temporal qualitative analysis of quantitative transcript and protein profiles is applied to show the role of the BREVIS RADIX (BRX) protein in the auxin- cytokinin crosstalk for root meristem growth. Core of this PhD work is the functional characterization of the interplay between the BRX protein and the plant hormone auxin in the root meristem by using a computational model based on experimental evidence. Hyphotesis generated by the modelled to the discovery of a differential endocytosis pattern in the root meristem that splits the auxin transcriptional response via the plasma membrane to nucleus partitioning of BRX. This positional information system creates an auxin transcriptional pattern that deviates from the canonical auxin response and is necessary to sustain the expression of a subset of BRX-dependent auxin-responsive genes to drive root meristem growth. In the second part of this PhD thesis, we characterized the genome-wide impact of large scale deletions on four divergent Arabidopsis natural strains, through the integration of Ultra-High Throughput Sequencing data with data from genomic hybridizations on tiling arrays. Analysis of the identified deletions revealed a considerable portion of protein coding genes affected and supported a history of genomic rearrangements shaped by evolution. In the last part of the thesis, we showed that VIP3 gene in Arabidopsis has an evo-lutionary conserved role in the 3' to 5' mRNA degradation machinery, by applying a novel approach for the analysis of mRNA-Seq data from random-primed mRNA. Altogether, this PhD research contains major advancements in the study of natural genomic variation in plants and in the application of computational morphodynamics models for the functional characterization of biological pathways essential for the plant. - Récemment, l'introduction du séquençage de seconde génération et les avancées dans la microscopie confocale ont permis des études à l'échelle des différents systèmes cellulaires pour la caractérisation fonctionnelle de gènes. Le degrés de complexité intrinsèque à ces approches ont requis le développement de méthodologies bioinformatiques et de modèles mathématiques afin d'extraire de la masse de données expérimentale générée, des information biologiques significatives. Ce doctorat présente à la fois des méthodes bioinformatiques originales et des modèles mathématiques pour répondre à certaines questions spécifiques de Biologie Végétale en utilisant la plante Arabidopsis thaliana comme modèle. Premièrement, une analyse qualitative spatio-temporelle de profiles quantitatifs de transcripts et de protéines est utilisée pour montrer le rôle de la protéine BREVIS RADIX (BRX) dans le dialogue entre l'auxine et les cytokinines, des phytohormones, dans la croissance du méristème racinaire. Le noyau de ce travail de thèse est la caractérisation fonctionnelle de l'interaction entre la protéine BRX et la phytohormone auxine dans le méristème de la racine en utilisant des modèles informatiques basés sur des preuves expérimentales. Les hypothèses produites par le modèle ont mené à la découverte d'un schéma différentiel d'endocytose dans le méristème racinaire qui divise la réponse transcriptionnelle à l'auxine par le partitionnement de BRX de la membrane plasmique au noyau de la cellule. Cette information positionnelle crée une réponse transcriptionnelle à l'auxine qui dévie de la réponse canonique à l'auxine et est nécessaire pour soutenir l'expression d'un sous ensemble de gènes répondant à l'auxine et dépendant de BRX pour conduire la croissance du méristème. Dans la seconde partie de cette thèse de doctorat, nous avons caractérisé l'impact sur l'ensemble du génome des délétions à grande échelle sur quatre souches divergentes naturelles d'Arabidopsis, à travers l'intégration du séquençage à ultra-haut-débit avec l'hybridation génomique sur puces ADN. L'analyse des délétions identifiées a révélé qu'une proportion considérable de gènes codant était affectée, supportant l'idée d'un historique de réarrangement génomique modelé durant l'évolution. Dans la dernière partie de cette thèse, nous avons montré que le gène VÏP3 dans Arabidopsis a conservé un rôle évolutif dans la machinerie de dégradation des ARNm dans le sens 3' à 5', en appliquant une nouvelle approche pour l'analyse des données de séquençage d'ARNm issue de transcripts amplifiés aléatoirement. Dans son ensemble, cette recherche de doctorat contient des avancées majeures dans l'étude des variations génomiques naturelles des plantes et dans l'application de modèles morphodynamiques informatiques pour la caractérisation de réseaux biologiques essentiels à la plante. - Le développement des plantes est écrit dans leurs codes génétiques. Pour comprendre comment les plantes sont capables de s'adapter aux changements environnementaux, il est essentiel d'étudier comment leurs gènes gouvernent leur formation. Plus nous essayons de comprendre le fonctionnement d'une plante, plus nous réalisons la complexité des mécanismes biologiques, à tel point que l'utilisation d'outils et de modèles mathématiques devient indispensable. Dans ce travail, avec l'utilisation de la plante modèle Arabidopsis thalicinci nous avons résolu des problèmes biologiques spécifiques à travers le développement et l'application de méthodes informatiques concrètes. Dans un premier temps, nous avons investigué comment le gène BREVIS RADIX (BRX) régule le développement de la racine en contrôlant la réponse à deux hormones : l'auxine et la cytokinine. Nous avons employé une analyse statistique sur des mesures quantitatives de transcripts et de produits de gènes afin de démontrer que BRX joue un rôle antagonisant dans le dialogue entre ces deux hormones. Lorsque ce-dialogue moléculaire est perturbé, la racine primaire voit sa longueur dramatiquement réduite. Pour comprendre comment BRX répond à l'auxine, nous avons développé un modèle informatique basé sur des résultats expérimentaux. Les simulations successives ont mené à la découverte d'un signal positionnel qui contrôle la réponse de la racine à l'auxine par la régulation du mouvement intracellulaire de BRX. Dans la seconde partie de cette thèse, nous avons analysé le génome entier de quatre souches naturelles d'Arabidopsis et nous avons trouvé qu'une grande partie de leurs gènes étaient manquant par rapport à la souche de référence. Ce résultat indique que l'historique des modifications génomiques conduites par l'évolution détermine une disponibilité différentielle des gènes fonctionnels dans ces plantes. Dans la dernière partie de ce travail, nous avons analysé les données du transcriptome de la plante où le gène VIP3 était non fonctionnel. Ceci nous a permis de découvrir le rôle double de VIP3 dans la régulation de l'initiation de la transcription et dans la dégradation des transcripts. Ce rôle double n'avait jusqu'alors été démontrée que chez l'homme. Ce travail de doctorat supporte le développement et l'application de méthodologies informatiques comme outils inestimables pour résoudre la complexité des problèmes biologiques dans la recherche végétale. L'intégration de la biologie végétale et l'informatique est devenue de plus en plus importante pour l'avancée de nos connaissances sur le fonctionnement et le développement des plantes.