29 resultados para BIO-09
Resumo:
Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal.
Resumo:
Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal.
Resumo:
Cette thèse présente des méthodes de traitement de données de comptage en particulier et des données discrètes en général. Il s'inscrit dans le cadre d'un projet stratégique du CRNSG, nommé CC-Bio, dont l'objectif est d'évaluer l'impact des changements climatiques sur la répartition des espèces animales et végétales. Après une brève introduction aux notions de biogéographie et aux modèles linéaires mixtes généralisés aux chapitres 1 et 2 respectivement, ma thèse s'articulera autour de trois idées majeures. Premièrement, nous introduisons au chapitre 3 une nouvelle forme de distribution dont les composantes ont pour distributions marginales des lois de Poisson ou des lois de Skellam. Cette nouvelle spécification permet d'incorporer de l'information pertinente sur la nature des corrélations entre toutes les composantes. De plus, nous présentons certaines propriétés de ladite distribution. Contrairement à la distribution multidimensionnelle de Poisson qu'elle généralise, celle-ci permet de traiter les variables avec des corrélations positives et/ou négatives. Une simulation permet d'illustrer les méthodes d'estimation dans le cas bidimensionnel. Les résultats obtenus par les méthodes bayésiennes par les chaînes de Markov par Monte Carlo (CMMC) indiquent un biais relatif assez faible de moins de 5% pour les coefficients de régression des moyennes contrairement à ceux du terme de covariance qui semblent un peu plus volatils. Deuxièmement, le chapitre 4 présente une extension de la régression multidimensionnelle de Poisson avec des effets aléatoires ayant une densité gamma. En effet, conscients du fait que les données d'abondance des espèces présentent une forte dispersion, ce qui rendrait fallacieux les estimateurs et écarts types obtenus, nous privilégions une approche basée sur l'intégration par Monte Carlo grâce à l'échantillonnage préférentiel. L'approche demeure la même qu'au chapitre précédent, c'est-à-dire que l'idée est de simuler des variables latentes indépendantes et de se retrouver dans le cadre d'un modèle linéaire mixte généralisé (GLMM) conventionnel avec des effets aléatoires de densité gamma. Même si l'hypothèse d'une connaissance a priori des paramètres de dispersion semble trop forte, une analyse de sensibilité basée sur la qualité de l'ajustement permet de démontrer la robustesse de notre méthode. Troisièmement, dans le dernier chapitre, nous nous intéressons à la définition et à la construction d'une mesure de concordance donc de corrélation pour les données augmentées en zéro par la modélisation de copules gaussiennes. Contrairement au tau de Kendall dont les valeurs se situent dans un intervalle dont les bornes varient selon la fréquence d'observations d'égalité entre les paires, cette mesure a pour avantage de prendre ses valeurs sur (-1;1). Initialement introduite pour modéliser les corrélations entre des variables continues, son extension au cas discret implique certaines restrictions. En effet, la nouvelle mesure pourrait être interprétée comme la corrélation entre les variables aléatoires continues dont la discrétisation constitue nos observations discrètes non négatives. Deux méthodes d'estimation des modèles augmentés en zéro seront présentées dans les contextes fréquentiste et bayésien basées respectivement sur le maximum de vraisemblance et l'intégration de Gauss-Hermite. Enfin, une étude de simulation permet de montrer la robustesse et les limites de notre approche.
Resumo:
Essai critique présenté à la Faculté des études supérieures en vue de l’obtention du grade de M.Sc. en service social
Resumo:
L’inférence de génomes ancestraux est une étape essentielle pour l’étude de l’évolution des génomes. Connaissant les génomes d’espèces éteintes, on peut proposer des mécanismes biologiques expliquant les divergences entre les génomes des espèces modernes. Diverses méthodes visant à résoudre ce problème existent, se classant parmis deux grandes catégories : les méthodes de distance et les méthodes de synténie. L’état de l’art des distances génomiques ne permettant qu’un certain répertoire de réarrangements pour le moment, les méthodes de synténie sont donc plus appropriées en pratique. Nous proposons une méthode de synténie pour la reconstruction de génomes ancestraux basée sur une définition relaxée d’adjacences de gènes, permettant un contenu en gène inégal dans les génomes modernes causé par des pertes de gènes de même que des duplications de génomes entiers (DGE). Des simulations sont effectuées, démontrant une capacité de former une solution assemblée en un nombre réduit de régions ancestrales contigües par rapport à d’autres méthodes tout en gardant une bonne fiabilité. Des applications sur des données de levures et de plantes céréalières montrent des résultats en accord avec d’autres publications, notamment la présence de fusion imbriquée de chromosomes pendant l’évolution des céréales.
Resumo:
La fibrillation auriculaire (FA) est le trouble du rythme le plus fréquemment observé en pratique clinique. Elle constitue un risque important de morbi-mortalité. Le traitement de la FA reste un défi majeur en lien avec les nombreux effets secondaires associés aux approches thérapeutiques actuelles. Dans ce contexte, une meilleure compréhension des mécanismes sous-jacents à la FA est essentielle pour le développement de nouvelles thérapies offrant un meilleur rapport bénéfice/risque pour les patients. La FA est caractérisée par i) un remodelage électrique délétère associé le plus souvent ii) à un remodelage structurel du myocarde favorisant la récurrence et le maintien de l’arythmie. La diminution de la période réfractaire effective au sein du tissu auriculaire est un élément clef du remodelage électrique. Le remodelage structurel, quant à lui, se manifeste principalement par une fibrose tissulaire qui altère la propagation de l’influx électrique dans les oreillettes. Les mécanismes moléculaires impliqués dans la mise en place de ces deux substrats restent mal connus. Récemment, le rôle des microARNs (miARNs) a été pointé du doigt dans de nombreuses pathologies notamment cardiaques. Dans ce contexte les objectifs principaux de ce travail ont été i) d'acquérir une compréhension approfondie du rôle des miARNs dans la régulation de l’expression des canaux ioniques et ii) de mieux comprendre le rôle de ces molécules dans l’installation d’un substrat favorable a la FA. Nous avons, dans un premier temps, effectué une analyse bio-informatique combinée à des approches expérimentales spécifiques afin d’identifier clairement les miARNs démontrant un fort potentiel de régulation des gènes codant pour l’expression des canaux ioniques cardiaques humains. Nous avons identifié un nombre limité de miARNs cardiaques qui possédaient ces propriétés. Sur la base de ces résultats, nous avons démontré que l’altération de l'expression des canaux ioniques, observée dans diverse maladies cardiaques (par exemple, les cardiomyopathies, l’ischémie myocardique, et la fibrillation auriculaire), peut être soumise à ces miARNs suggérant leur implication dans l’arythmogénèse. La régulation du courant potassique IK1 est un facteur déterminant du remodelage électrique auriculaire associée à la FA. Les mécanismes moléculaires sous-jacents sont peu connus. Nous avons émis l’hypothèse que l'altération de l’expression des miARNs soit corrélée à l’augmentation de l’expression d’IK1 dans la FA. Nous avons constaté que l’expression de miR-26 est réduite dans la FA et qu’elle régule IK1 en modulant l’expression de sa sous-unité Kir2.1. Nous avons démontré que miR-26 est sous la répression transcriptionnelle du facteur nucléaire des lymphocytes T activés (NFAT) et que l’activité accrue de NFATc3/c4, aboutit à une expression réduite de miR-26. En conséquence IK1 augmente lors de la FA. Nous avons enfin démontré que l’interférence in vivo de miR-26 influence la susceptibilité à la FA en régulant IK1, confirmant le rôle prépondérant de miR-26 dans le remodelage auriculaire électrique. La fibrose auriculaire est un constituant majeur du remodelage structurel associé à la FA, impliquant l'activation des fibroblastes et l’influx cellulaire du Ca2 +. Nous avons cherché à déterminer i) si le canal perméable au Ca2+, TRPC3, jouait un rôle dans la fibrose auriculaire en favorisant l'activation des fibroblastes et ii) étudié le rôle potentiel des miARNs dans ce contexte. Nous avons démontré que les canaux TRPC3 favorisent l’influx du Ca2 +, activant la signalisation Ca2 +-dépendante ERK et en conséquence activent la prolifération des fibroblastes. Nous avons également démontré que l’expression du TRPC3 est augmentée dans la FA et que le blocage in vivo de TRPC3 empêche le développement de substrats reliés à la FA. Nous avons par ailleurs validé que miR-26 régule les canaux TRPC3 en diminuant leur expression dans les fibroblastes. Enfin, nous avons montré que l'expression réduite du miR-26 est également due à l’activité augmentée de NFATc3/c4 dans les fibroblastes, expliquant ainsi l’augmentation de TRPC3 lors de la FA, confirmant la contribution de miR-26 dans le processus de remodelage structurel lié à la FA. En conclusion, nos résultats mettent en évidence l'importance des miARNs dans la régulation des canaux ioniques cardiaques. Notamment, miR-26 joue un rôle important dans le remodelage électrique et structurel associé à la FA et ce, en régulant IK1 et l’expression du canal TRPC3. Notre étude démasque ainsi un mécanisme moléculaire de contrôle de la FA innovateur associant des miARNs. miR-26 en particulier représente apres ces travaux une nouvelle cible thérapeutique prometteuse pour traiter la FA.
Resumo:
Un papier bioactif est obtenu par la modification d’un papier en y immobilisant une ou plusieurs biomolécules. La recherche et le développement de papiers bioactifs est en plein essor car le papier est un substrat peu dispendieux qui est déjà d’usage très répandu à travers le monde. Bien que les papiers bioactifs n’aient pas connus de succès commercial depuis la mise en marche de bandelettes mesurant le taux de glucose dans les années cinquante, de nombreux groupes de recherche travaillent à immobiliser des biomolécules sur le papier pour obtenir un papier bioactif qui est abordable et possède une bonne durée de vie. Contrairement à la glucose oxidase, l’enzyme utilisée sur ces bandelettes, la majorité des biomolécules sont très fragiles et perdent leur activité très rapidement lorsqu’immobilisées sur des papiers. Le développement de nouveaux papiers bioactifs pouvant détecter des substances d’intérêt ou même désactiver des pathogènes dépend donc de découverte de nouvelles techniques d’immobilisation des biomolécules permettant de maintenir leur activité tout en étant applicable dans la chaîne de production actuelle des papiers fins. Le but de cette thèse est de développer une technique d’immobilisation efficace et versatile, permettant de protéger l’activité de biomolécules incorporées sur des papiers. La microencapsulation a été choisie comme technique d’immobilisation car elle permet d’enfermer de grandes quantités de biomolécules à l’intérieur d’une sphère poreuse permettant leur protection. Pour cette étude, le polymère poly(éthylènediimine) a été choisi afin de générer la paroi des microcapsules. Les enzymes laccase et glucose oxidase, dont les propriétés sont bien établies, seront utilisées comme biomolécules test. Dans un premier temps, deux procédures d’encapsulation ont été développées puis étudiées. La méthode par émulsion produit des microcapsules de plus petits diamètres que la méthode par encapsulation utilisant un encapsulateur, bien que cette dernière offre une meilleure efficacité d’encapsulation. Par la suite, l’effet de la procédure d’encapsulation sur l’activité enzymatique et la stabilité thermique des enzymes a été étudié à cause de l’importance du maintien de l’activité sur le développement d’une plateforme d’immobilisation. L’effet de la nature du polymère utilisé pour la fabrication des capsules sur la conformation de l’enzyme a été étudié pour la première fois. Finalement, l’applicabilité des microcapsules de poly(éthylèneimine) dans la confection de papiers bioactifs a été démontré par le biais de trois prototypes. Un papier réagissant au glucose a été obtenu en immobilisant des microcapsules contenant l’enzyme glucose oxidase. Un papier sensible à l’enzyme neuraminidase pour la détection de la vaginose bactérienne avec une plus grande stabilité durant l’entreposage a été fait en encapsulant les réactifs colorimétriques dans des capsules de poly(éthylèneimine). L’utilisation de microcapsules pour l’immobilisation d’anticorps a également été étudiée. Les avancées au niveau de la plateforme d’immobilisation de biomolécules par microencapsulation qui ont été réalisées lors de cette thèse permettront de mieux comprendre l’effet des réactifs impliqués dans la procédure de microencapsulation sur la stabilité, l’activité et la conformation des biomolécules. Les résultats obtenus démontrent que la plateforme d’immobilisation développée peut être appliquée pour la confection de nouveaux papiers bioactifs.
Resumo:
Les traits quantitatifs complexes sont des caractéristiques mesurables d’organismes vivants qui résultent de l’interaction entre plusieurs gènes et facteurs environnementaux. Les locus génétiques liés à un caractère complexe sont appelés «locus de traits quantitatifs » (QTL). Récemment, en considérant les niveaux d’expression tissulaire de milliers de gènes comme des traits quantitatifs, il est devenu possible de détecter des «QTLs d’expression» (eQTL). Alors que ces derniers ont été considérés comme des phénotypes intermédiaires permettant de mieux comprendre l’architecture biologique des traits complexes, la majorité des études visent encore à identifier une mutation causale dans un seul gène. Cette approche ne peut remporter du succès que dans les situations où le gène incriminé a un effet majeur sur le trait complexe, et ne permet donc pas d’élucider les situations où les traits complexes résultent d’interactions entre divers gènes. Cette thèse propose une approche plus globale pour : 1) tenir compte des multiples interactions possibles entre gènes pour la détection de eQTLs et 2) considérer comment des polymorphismes affectant l’expression de plusieurs gènes au sein de groupes de co-expression pourraient contribuer à des caractères quantitatifs complexes. Nos contributions sont les suivantes : Nous avons développé un outil informatique utilisant des méthodes d’analyse multivariées pour détecter des eQTLs et avons montré que cet outil augmente la sensibilité de détection d’une classe particulière de eQTLs. Sur la base d’analyses de données d’expression de gènes dans des tissus de souris recombinantes consanguines, nous avons montré que certains polymorphismes peuvent affecter l’expression de plusieurs gènes au sein de domaines géniques de co-expression. En combinant des études de détection de eQTLs avec des techniques d’analyse de réseaux de co-expression de gènes dans des souches de souris recombinantes consanguines, nous avons montré qu’un locus génétique pouvait être lié à la fois à l’expression de plusieurs gènes au niveau d’un domaine génique de co-expression et à un trait complexe particulier (c.-à-d. la masse du ventricule cardiaque gauche). Au total, nos études nous ont permis de détecter plusieurs mécanismes par lesquels des polymorphismes génétiques peuvent être liés à l’expression de plusieurs gènes, ces derniers pouvant eux-mêmes être liés à des traits quantitatifs complexes.
Resumo:
Les facteurs de transcription sont des protéines spécialisées qui jouent un rôle important dans différents processus biologiques tel que la différenciation, le cycle cellulaire et la tumorigenèse. Ils régulent la transcription des gènes en se fixant sur des séquences d’ADN spécifiques (éléments cis-régulateurs). L’identification de ces éléments est une étape cruciale dans la compréhension des réseaux de régulation des gènes. Avec l’avènement des technologies de séquençage à haut débit, l’identification de tout les éléments fonctionnels dans les génomes, incluant gènes et éléments cis-régulateurs a connu une avancée considérable. Alors qu’on est arrivé à estimer le nombre de gènes chez différentes espèces, l’information sur les éléments qui contrôlent et orchestrent la régulation de ces gènes est encore mal définie. Grace aux techniques de ChIP-chip et de ChIP-séquençage il est possible d’identifier toutes les régions du génome qui sont liées par un facteur de transcription d’intérêt. Plusieurs approches computationnelles ont été développées pour prédire les sites fixés par les facteurs de transcription. Ces approches sont classées en deux catégories principales: les algorithmes énumératifs et probabilistes. Toutefois, plusieurs études ont montré que ces approches génèrent des taux élevés de faux négatifs et de faux positifs ce qui rend difficile l’interprétation des résultats et par conséquent leur validation expérimentale. Dans cette thèse, nous avons ciblé deux objectifs. Le premier objectif a été de développer une nouvelle approche pour la découverte des sites de fixation des facteurs de transcription à l’ADN (SAMD-ChIP) adaptée aux données de ChIP-chip et de ChIP-séquençage. Notre approche implémente un algorithme hybride qui combine les deux stratégies énumérative et probabiliste, afin d’exploiter les performances de chacune d’entre elles. Notre approche a montré ses performances, comparée aux outils de découvertes de motifs existants sur des jeux de données simulées et des jeux de données de ChIP-chip et de ChIP-séquençage. SAMD-ChIP présente aussi l’avantage d’exploiter les propriétés de distributions des sites liés par les facteurs de transcription autour du centre des régions liées afin de limiter la prédiction aux motifs qui sont enrichis dans une fenêtre de longueur fixe autour du centre de ces régions. Les facteurs de transcription agissent rarement seuls. Ils forment souvent des complexes pour interagir avec l’ADN pour réguler leurs gènes cibles. Ces interactions impliquent des facteurs de transcription dont les sites de fixation à l’ADN sont localisés proches les uns des autres ou bien médier par des boucles de chromatine. Notre deuxième objectif a été d’exploiter la proximité spatiale des sites liés par les facteurs de transcription dans les régions de ChIP-chip et de ChIP-séquençage pour développer une approche pour la prédiction des motifs composites (motifs composés par deux sites et séparés par un espacement de taille fixe). Nous avons testé ce module pour prédire la co-localisation entre les deux demi-sites ERE qui forment le site ERE, lié par le récepteur des œstrogènes ERα. Ce module a été incorporé à notre outil de découverte de motifs SAMD-ChIP.
Resumo:
Les études génétiques, telles que les études de liaison ou d’association, ont permis d’acquérir une plus grande connaissance sur l’étiologie de plusieurs maladies affectant les populations humaines. Même si une dizaine de milliers d’études génétiques ont été réalisées sur des centaines de maladies ou autres traits, une grande partie de leur héritabilité reste inexpliquée. Depuis une dizaine d’années, plusieurs percées dans le domaine de la génomique ont été réalisées. Par exemple, l’utilisation des micropuces d’hybridation génomique comparative à haute densité a permis de démontrer l’existence à grande échelle des variations et des polymorphismes en nombre de copies. Ces derniers sont maintenant détectables à l’aide de micropuce d’ADN ou du séquençage à haut débit. De plus, des études récentes utilisant le séquençage à haut débit ont permis de démontrer que la majorité des variations présentes dans l’exome d’un individu étaient rares ou même propres à cet individu. Ceci a permis la conception d’une nouvelle micropuce d’ADN permettant de déterminer rapidement et à faible coût le génotype de plusieurs milliers de variations rares pour un grand ensemble d’individus à la fois. Dans ce contexte, l’objectif général de cette thèse vise le développement de nouvelles méthodologies et de nouveaux outils bio-informatiques de haute performance permettant la détection, à de hauts critères de qualité, des variations en nombre de copies et des variations nucléotidiques rares dans le cadre d’études génétiques. Ces avancées permettront, à long terme, d’expliquer une plus grande partie de l’héritabilité manquante des traits complexes, poussant ainsi l’avancement des connaissances sur l’étiologie de ces derniers. Un algorithme permettant le partitionnement des polymorphismes en nombre de copies a donc été conçu, rendant possible l’utilisation de ces variations structurales dans le cadre d’étude de liaison génétique sur données familiales. Ensuite, une étude exploratoire a permis de caractériser les différents problèmes associés aux études génétiques utilisant des variations en nombre de copies rares sur des individus non reliés. Cette étude a été réalisée avec la collaboration du Wellcome Trust Centre for Human Genetics de l’University of Oxford. Par la suite, une comparaison de la performance des algorithmes de génotypage lors de leur utilisation avec une nouvelle micropuce d’ADN contenant une majorité de marqueurs rares a été réalisée. Finalement, un outil bio-informatique permettant de filtrer de façon efficace et rapide des données génétiques a été implémenté. Cet outil permet de générer des données de meilleure qualité, avec une meilleure reproductibilité des résultats, tout en diminuant les chances d’obtenir une fausse association.
Resumo:
L’azote est l’élément le plus abondant dans l’atmosphère terrestre avec un pourcentage atteignant 78 %. Composant essentiel pour la biosynthèse des matériels organiques cellulaires, il est inutilisable sous sa forme diatomique (N2) très stable par la plupart des organismes. Seules les bactéries dites diazotrophiques comme Rhodobacter capsulatus sont capables de fixer l’azote moléculaire N2 par le biais de la synthèse d’une enzyme, la nitrogénase. Cette dernière catalyse la réduction du N2 en ammonium (NH4) qui peut alors être assimilé par d’autres organismes. La synthèse et l’activité de la nitrogénase consomment beaucoup d’énergie ce qui implique une régulation rigoureuse et son inhibition tant qu’une quantité suffisante d’ammonium est disponible. Parmi les protéines impliquées dans cette régulation, la protéine d’intérêt AmtB est un transporteur membranaire responsable de la perception et le transport de l’ammonium. Chez R. capsulatus, il a été démontré que suite à l’addition de l’ammonium, l’AmtB inhibe de façon réversible (switch off/switch on) l’activité de la nitrogénase en séquestrant la protéine PII GlnK accompagnée de l’ajout d’un groupement ADP ribose sur la sous unités Fe de l’enzyme par DraT. De plus, la formation de ce complexe à lui seul ne serait pas suffisant pour cette inactivation, ce qui suggère la séquestration d’une troisième protéine, DraG, afin d’inhiber son action qui consiste à enlever l’ADP ribose de la nitrogénase et donc sa réactivation. Afin de mieux comprendre le fonctionnement de l’AmtB dans la régulation et le transport de l’ammonium à un niveau moléculaire et par la même occasion la fixation de l’azote, le premier volet de ce mémoire a été d’introduire une mutation ponctuelle par mutagénèse dirigée au niveau du résidu conservé W237 de l’AmtB. La production d’hydrogène est un autre aspect longtemps étudié chez R. capsulatus. Cette bactérie est capable de produire de l’hydrogène à partir de composés organiques par photofermentation suite à l’intervention exclusive de la nitrogénase. Plusieurs études ont été entreprises afin d’améliorer la production d’hydrogène. Certaines d’entre elles se sont intéressées à déterminer les conditions optimales qui confèrent une production maximale de gaz tandis que d’autres s’intéressent au fonctionnement de la bactérie elle même. Ainsi, le fait que la bioproduction de H2 par fermentation soit catalysée par la nitrogénase cela implique la régulation de l’activité de cette dernière par différents mécanismes dont le switch off par ADP ribosylation de l’enzyme. De ce fait, un mutant de R. capsulatus dépourvu d’AmtB (DG9) a été étudié dans la deuxième partie de cette thèse en termes d’activité de la nitrogénase, de sa modification par ADP ribosylation avec la détection des deux protéines GlnK et DraG qui interviennent dans cette régulation pour connaitre l’influence de différents acides aminés sur la régulation de la nitrogénase et pour l‘utilisation future de cette souche dans la production d’H2 car R. capsulatus produit de l’hydrogène par photofermentation grâce à cette enzyme. Les résultats obtenus ont révélé une activité de la nitrogénase continue et ininterrompue lorsque l’AmtB est absent avec une activité maximale quand la proline est utilisée comme source d’azote durant la culture bactérienne ce qui implique donc que l’abolition de l’activité de cette protéine entraine une production continue d’H2 chez R. capsulatus lorsque la proline est utilisée comme source d’azote lors de la culture bactérienne. Par ailleurs, avec des Western blots on a pu déterminer l’absence de régulation par ADP ribosylation ainsi que les expressions respectives de GlnK et DraG inchangées entre R. capsulatus sauvage et muté. En conclusion, la nitrogénase n’est pas modifiée et inhibée lorsque l’amtB est muté ce qui fait de la souche R. capsulatus DG9 un candidat idéal pour la production de biohydrogène en particulier lorsque du glucose et de la proline sont respectivement utilisés comme source de carbone et d'azote pour la croissance.
Resumo:
L’anémie falciforme est une maladie monogénique causée par une mutation dans le locus de la β-globine. Malgré le fait que l’anémie falciforme soit une maladie monogénique, cette maladie présente une grande hétérogénéité clinique. On présume que des facteurs environnementaux et génétiques contribuent à cette hétérogénéité. Il a été observé qu’un haut taux d’hémoglobine fœtale (HbF) diminuait la sévérité et la mortalité des patients atteints de l’anémie falciforme. Le but de mon projet était d’identifier des variations génétiques modifiant la sévérité clinique de l’anémie falciforme. Dans un premier temps, nous avons effectué la cartographie-fine de trois régions précédemment associées avec le taux d’hémoglobine fœtale. Nous avons ensuite effectué des études d’association pan-génomiques avec deux complications cliniques de l’anémie falciforme ainsi qu’avec le taux d’hémoglobine fœtale. Hormis les régions déjà identifiées comme étant associées au taux d’hémoglobine fœtale, aucun locus n’a atteint le niveau significatif de la puce de génotypage. Pour identifier des groupes de gènes modérément associés au taux d’hémoglobine fœtale qui seraient impliqués dans de mêmes voies biologiques, nous avons effectué une étude des processus biologiques. Finalement, nous avons effectué l’analyse de 19 exomes de patients Jamaïcains ayant des complications cliniques mineures de l’anémie falciforme. Compte tenu de la taille des cohortes de réplication disponibles, nous n’avons pas les moyens de valider statistiquement les variations identifiées par notre étude. Cependant, nos résultats fournissent de bons gènes candidats pour des études fonctionnelles et pour les réplications futures. Nos résultats suggèrent aussi que le β-hydroxybutyrate en concentration endogène pourraient influencer le taux d’hémoglobine fœtale. De plus, nous montrons que la cartographie-fine des régions associées par des études pan-génomiques peut identifier des signaux d’association additionnels et augmenter la variation héritable expliquée par cette région.
Resumo:
Des évidences expérimentales récentes indiquent que les ARN changent de structures au fil du temps, parfois très rapidement, et que ces changements sont nécessaires à leurs activités biochimiques. La structure de ces ARN est donc dynamique. Ces mêmes évidences notent également que les structures clés impliquées sont prédites par le logiciel de prédiction de structure secondaire MC-Fold. En comparant les prédictions de structures du logiciel MC-Fold, nous avons constaté un lien clair entre les structures presque optimales (en termes de stabilité prédites par ce logiciel) et les variations d’activités biochimiques conséquentes à des changements ponctuels dans la séquence. Nous avons comparé les séquences d’ARN du point de vue de leurs structures dynamiques afin d’investiguer la similarité de leurs fonctions biologiques. Ceci a nécessité une accélération notable du logiciel MC-Fold. L’approche algorithmique est décrite au chapitre 1. Au chapitre 2 nous classons les impacts de légères variations de séquences des microARN sur la fonction naturelle de ceux-ci. Au chapitre 3 nous identifions des fenêtres dans de longs ARN dont les structures dynamiques occupent possiblement des rôles dans les désordres du spectre autistique et dans la polarisation des œufs de certains batraciens (Xenopus spp.).
Resumo:
L’objectif de ce projet était de faire le lien entre gènes et métabolites afin d’éventuellement proposer des métabolites à mesurer en lien avec la fonction de gènes. Plus particulièrement, nous nous sommes intéressés aux gènes codant pour des protéines ayant un impact sur le métabolisme, soit les enzymes qui catalysent les réactions faisant partie intégrante des voies métaboliques. Afin de quantifier ce lien, nous avons développé une méthode bio-informatique permettant de calculer la distance qui est définie comme le nombre de réactions entre l’enzyme encodée par le gène et le métabolite dans la carte globale du métabolisme de la base de données Kyoto Encyclopedia of Genes and Genomes (KEGG). Notre hypothèse était que les métabolites d’intérêt sont des substrats/produits se trouvant à proximité des réactions catalysées par l’enzyme encodée par le gène. Afin de tester cette hypothèse et de valider la méthode, nous avons utilisé les études d’association pangénomique combinées à la métabolomique (mGWAS) car elles rapportent des associations entre variants génétiques, annotés en gènes, et métabolites mesurés. Plus précisément, la méthode a été appliquée à l’étude mGWAS par Shin et al. Bien que la couverture des associations de Shin et al. était limitée (24/299), nous avons pu valider de façon significative la proximité entre gènes et métabolites associés (P<0,01). En somme, cette méthode et ses développements futurs permettront d’interpréter de façon quantitative les associations mGWAS, de prédire quels métabolites mesurer en lien avec la fonction d’un gène et, plus généralement, de permettre une meilleure compréhension du contrôle génétique sur le métabolisme.