282 resultados para Algorithmes Génétiques
Resumo:
La famille des gènes Hox code pour des facteurs de transcription connus pour leur contribution essentielle à l’élaboration de l’architecture du corps et ce, au sein de tout le règne animal. Au cours de l’évolution chez les vertébrés, les gènes Hox ont été redéfinis pour générer toute une variété de nouveaux tissus/organes. Souvent, cette diversification s’est effectuée via des changements quant au contrôle transcriptionnel des gènes Hox. Chez les mammifères, la fonction de Hoxa13 n’est pas restreinte qu’à l’embryon même, mais s’avère également essentielle pour le développement de la vascularisation fœtale au sein du labyrinthe placentaire, suggérant ainsi que sa fonction au sein de cette structure aurait accompagné l’émergence des espèces placentaires. Au chapitre 2, nous mettons en lumière le recrutement de deux autres gènes Hoxa, soient Hoxa10 et Hoxa11, au compartiment extra-embryonnaire. Nous démontrons que l’expression de Hoxa10, Hoxa11 et Hoxa13 est requise au sein de l’allantoïde, précurseur du cordon ombilical et du système vasculaire fœtal au sein du labyrinthe placentaire. De façon intéressante, nous avons découvert que l’expression des gènes Hoxa10-13 dans l’allantoïde n’est pas restreinte qu’aux mammifères placentaires, mais est également présente chez un vertébré non-placentaire, indiquant que le recrutement des ces gènes dans l’allantoïde précède fort probablement l’émergence des espèces placentaires. Nous avons généré des réarrangements génétiques et utilisé des essais transgéniques pour étudier les mécanismes régulant l’expression des gènes Hoxa dans l’allantoïde. Nous avons identifié un fragment intergénique de 50 kb capable d’induire l’expression d’un gène rapporteur dans l’allantoïde. Cependant, nous avons trouvé que le mécanisme de régulation contrôlant l’expression du gène Hoxa au sein du compartiment extra-embryonnaire est fort complexe et repose sur plus qu’un seul élément cis-régulateur. Au chapitre 3, nous avons utilisé la cartographie génétique du destin cellulaire pour évaluer la contribution globale des cellules exprimant Hoxa13 aux différentes structures embryonnaires. Plus particulièrement, nous avons examiné plus en détail l’analyse de la cartographie du destin cellulaire de Hoxa13 dans les pattes antérieures en développement. Nous avons pu déterminer que, dans le squelette du membre, tous les éléments squelettiques de l’autopode (main), à l’exception de quelques cellules dans les éléments carpiens les plus proximaux, proviennent des cellules exprimant Hoxa13. En contraste, nous avons découvert que, au sein du compartiment musculaire, les cellules exprimant Hoxa13 et leurs descendantes (Hoxa13lin+) s’étendent à des domaines plus proximaux du membre, où ils contribuent à générer la plupart des masses musculaires de l’avant-bras et, en partie, du triceps. De façon intéressante, nous avons découvert que les cellules exprimant Hoxa13 et leurs descendantes ne sont pas distribuées uniformément parmi les différents muscles. Au sein d’une même masse musculaire, les fibres avec une contribution Hoxa13lin+ différente peuvent être identifiées et les fibres avec une contribution semblable sont souvent regroupées ensemble. Ce résultat évoque la possibilité que Hoxa13 soit impliqué dans la mise en place de caractéristiques spécifiques des groupes musculaires, ou la mise en place de connections nerf-muscle. Prises dans leur ensemble, les données ici présentées permettent de mieux comprendre le rôle de Hoxa13 au sein des compartiments embryonnaires et extra-embryonnaires. Par ailleurs, nos résultats seront d’une importance primordiale pour soutenir les futures études visant à expliquer les mécanismes transcriptionnels soutenant la régulation des gènes Hoxa dans les tissus extra-embryonnaires.
Resumo:
Le diabète est une maladie chronique de l’homéostasie du glucose caractérisée par une hyperglycémie non contrôlée qui est le résultat d’une défaillance de la sécrétion d’insuline en combinaison ou non avec une altération de l’action de l’insuline. La surnutrition et le manque d’activité physique chez des individus qui ont des prédispositions génétiques donnent lieu à la résistance à l’insuline. Pendant cette période dite de compensation où la concentration d’acides gras plasmatiques est élevée, l’hyperinsulinémie compense pleinement pour la résistance à l’insuline des tissus cibles et la glycémie est normale. Le métabolisme du glucose par la cellule pancréatique bêta entraîne la sécrétion d’insuline. Selon le modèle classique de la sécrétion d’insuline induite par le glucose, l’augmentation du ratio ATP/ADP résultant de la glycolyse et de l’oxydation du glucose, induit la fermeture des canaux KATP-dépendant modifiant ainsi le potentiel membranaire suivi d’un influx de Ca2+. Cet influx de Ca2+ permet l’exocytose des granules de sécrétion contenant l’insuline. Plusieurs nutriments comme les acides gras sont capables de potentialiser la sécrétion d’insuline. Cependant, le modèle classique ne permet pas d’expliquer cette potentialisation de la sécrétion d’insuline par les acides gras. Pour expliquer l’effet potentialisateur des acides gras, notre laboratoire a proposé un modèle complémentaire où le malonyl-CoA dérivé du métabolisme anaplérotique du glucose inhibe la carnitine palmitoyltransférase-1, l’enzyme qui constitue l’étape limitante de l’oxydation des acides gras favorisant ainsi leur estérification et donc la formation de dérivés lipidiques signalétiques. Le modèle anaplérotique/lipidique de la sécrétion d'insuline induite par le glucose prédit que le malonyl-CoA dérivé du métabolisme du glucose inhibe la bêta-oxydation des acides gras et augmente la disponibilité des acyl-CoA ou des acides gras non-estérifiés. Les molécules lipidiques agissant comme facteurs de couplage du métabolisme des acides gras à l'exocytose d'insuline sont encore inconnus. Des travaux réalisés par notre laboratoire ont démontré qu’en augmentant la répartition des acides gras vers la bêta-oxydation, la sécrétion d’insuline induite par le glucose était réduite suggérant qu’un des dérivés de l’estérification des acides gras est important pour la potentialisation sur la sécrétion d’insuline. En effet, à des concentrations élevées de glucose, les acides gras peuvent être estérifiés d’abord en acide lysophosphatidique (LPA), en acide phosphatidique (PA) et en diacylglycérol (DAG) et subséquemment en triglycérides (TG). La présente étude a établi l’importance relative du processus d’estérification des acides gras dans la production de facteurs potentialisant la sécrétion d’insuline. Nous avions émis l’hypothèse que des molécules dérivées des processus d’estérification des acides gras (ex : l’acide lysophosphatidique (LPA) et le diacylglycerol (DAG)) agissent comme signaux métaboliques et sont responsables de la modulation de la sécrétion d’insuline en présence d’acides gras. Afin de vérifier celle-ci, nous avons modifié le niveau d’expression des enzymes clés contrôlant le processus d’estérification par des approches de biologie moléculaire afin de changer la répartition des acides gras dans la cellule bêta. L’expression des différents isoformes de la glycérol-3-phosphate acyltransférase (GPAT), qui catalyse la première étape d’estérification des acides gras a été augmenté et inhibé. Les effets de la modulation de l’expression des isoenzymes de GPAT sur les processus d’estérifications, sur la bêta-oxydation et sur la sécrétion d’insuline induite par le glucose ont été étudiés. Les différentes approches que nous avons utilisées ont changé les niveaux de DAG et de TG sans toutefois altérer la sécrétion d’insuline induite par le glucose. Ainsi, les résultats de cette étude n’ont pas associé de rôle pour l’estérification de novo des acides gras dans leur potentialisation de la sécrétion d’insuline. Cependant, l’estérification des acides gras fait partie intégrante d’un cycle de TG/acides gras avec sa contrepartie lipolytique. D’ailleurs, des études parallèles à la mienne menées par des collègues du laboratoire ont démontré un rôle pour la lipolyse et un cycle TG/acides gras dans la potentialisation de la sécrétion d’insuline par les acides gras. Parallèlement à nos études des mécanismes de la sécrétion d’insuline impliquant les acides gras, notre laboratoire s’intéresse aussi aux effets négatifs des acides gras sur la cellule bêta. La glucolipotoxicité, résultant d’une exposition chronique aux acides gras saturés en présence d’une concentration élevée de glucose, est d’un intérêt particulier vu la prépondérance de l’obésité. L’isoforme microsomal de GPAT a aussi utilisé comme outil moléculaire dans le contexte de la glucolipotoxicité afin d’étudier le rôle de la synthèse de novo de lipides complexes dans le contexte de décompensation où la fonction des cellules bêta diminue. La surexpression de l’isoforme microsomal de la GPAT, menant à l’augmentation de l’estérification des acides gras et à une diminution de la bêta-oxydation, nous permet de conclure que cette modification métabolique est instrumentale dans la glucolipotoxicité.
Resumo:
La leucémie aiguë myéloïde est une hémopathie maligne génétiquement hétérogène caractérisée par de fréquents réarrangements impliquant la bande chromosomique 21q22 et le gène RUNX1. Dans ce groupe d’anomalies, les translocations t(8;21)(q22;q22) et t(3;21)(q26;q22), associées respectivement à un pronostic favorable et défavorable, sont les mieux étudiées. Or, plus de la moitié des réarrangements ciblant RUNX1 ne sont toujours pas caractérisés au niveau clinique et moléculaire. Les principaux objectifs de cette thèse sont de caractériser quatre nouvelles translocations ciblant RUNX1 et d’étudier la dérégulation transcriptionnelle associée à ces anomalies au niveau de cibles plus spécifiques ayant un rôle dans l’auto-renouvellement ou dans la différenciation hématopoïétique. À l’aide des techniques de cytogénétique et de biologie moléculaire, deux nouveaux partenaires de RUNX1, soit CLCA2 et SV2B, ont été identifiés au sein des t(1;21)(p22.3;q22) et t(15;21)(q26.1;q22) et la récurrence des partenaires USP42 et TRPS1 a été démontrée suite à l’étude des t(7;21)(p22.1;q22) et t(8;21)(q23.3;q22). Ce travail a permis de confirmer l’existence de divers modes de dérégulation de RUNX1 dans les leucémies aiguës. L’expression présumée de protéines chimériques et/ou d’isoformes tronquées de RUNX1, un dosage aberrant des transcrits de RUNX1 et la surexpression des gènes partenaires sont des conséquences révélées par l’étude de ces fusions. Le séquençage et l’analyse des jonctions génomiques des fusions récurrentes RUNX1-USP42/USP42-RUNX1 et RUNX1-TRPS1/TRPS1-RUNX1 ont démontré la présence de signatures moléculaires caractéristiques du mode de recombinaison non-homologue de type NHEJ. En raison de la structure et de la composition différente des jonctions, l’implication de composantes distinctes du mécanisme NHEJ a été proposée. Enfin, des analyses par PCR quantitative en temps réel nous ont permis de démontrer l’existence de cibles de dérégulation partagées par les fusions récurrentes et plus rares de RUNX1. Nous avons démontré que CEBPA est moins exprimé dans la majorité des spécimens étudiés présentant une fusion de RUNX1 par rapport aux spécimens avec un caryotype normal alors que JUP, une composante effectrice de la voie Wnt, est plutôt surexprimé. Malgré l’activation transcriptionnelle de JUP dans l’ensemble de ces spécimens, certaines cibles de la voie Wnt telles que CCND1 et MYC sont différemment exprimées dans ces cellules, appuyant l’hétérogénéité décrite dans ce groupe de leucémies. Malgré l’implication de partenaires variés, nos données d’expression démontrent que les chimères et les protéines tronquées de RUNX1 partagent des cibles communes d’activation et de répression transcriptionnelle et établissent, pour la première fois, des évidences moléculaires suggérant l’existence de similitudes entre la fusion récurrente RUNX1-RUNX1T1 et quatre fusions plus rares de RUNX1. Puisque des rechutes surviennent fréquemment dans ce groupe génétique, l’inhibition de JUP pourrait être une option thérapeutique intéressante et ceci est appuyé par les bénéfices observés lors de l’inhibition de la voie Wnt dans d’autres groupes génétiques de leucémies aiguës.
Resumo:
Mémoire numérisé par la Division de la gestion de documents et des archives de l'Université de Montréal.
Resumo:
Afin d’adresser la variabilité interindividuelle observée dans la réponse pharmacocinétique à de nombreux médicaments, nous avons créé un panel de génotypage personnalisée en utilisant des méthodes de conception et d’élaboration d’essais uniques. Celles-ci ont pour but premier de capturer les variations génétiques présentent dans les gènes clés impliqués dans les processus d'absorption, de distribution, de métabolisme et d’excrétion (ADME) de nombreux agents thérapeutiques. Bien que ces gènes et voies de signalement sont impliqués dans plusieurs mécanismes pharmacocinétiques qui sont bien connues, il y a eu jusqu’à présent peu d'efforts envers l’évaluation simultanée d’un grand nombre de ces gènes moyennant un seul outil expérimental. La recherche pharmacogénomique peut être réalisée en utilisant deux approches: 1) les marqueurs fonctionnels peuvent être utilisés pour présélectionner ou stratifier les populations de patients en se basant sur des états métaboliques connus; 2) les marqueurs Tag peuvent être utilisés pour découvrir de nouvelles corrélations génotype-phénotype. Présentement, il existe un besoin pour un outil de recherche qui englobe un grand nombre de gènes ADME et variantes et dont le contenu est applicable à ces deux modèles d'étude. Dans le cadre de cette thèse, nous avons développé un panel d’essais de génotypage de 3,000 marqueurs génétiques ADME qui peuvent satisfaire ce besoin. Dans le cadre de ce projet, les gènes et marqueurs associés avec la famille ADME ont été sélectionnés en collaboration avec plusieurs groupes du milieu universitaire et de l'industrie pharmaceutique. Pendant trois phases de développement de cet essai de génotypage, le taux de conversion pour 3,000 marqueurs a été amélioré de 83% à 97,4% grâce à l'incorporation de nouvelles stratégies ayant pour but de surmonter les zones d'interférence génomiques comprenant entre autres les régions homologues et les polymorphismes sous-jacent les régions d’intérêt. La précision du panel de génotypage a été validée par l’évaluation de plus de 200 échantillons pour lesquelles les génotypes sont connus pour lesquels nous avons obtenu une concordance > 98%. De plus, une comparaison croisée entre nos données provenant de cet essai et des données obtenues par différentes plateformes technologiques déjà disponibles sur le marché a révélé une concordance globale de > 99,5%. L'efficacité de notre stratégie de conception ont été démontrées par l'utilisation réussie de cet essai dans le cadre de plusieurs projets de recherche où plus de 1,000 échantillons ont été testés. Nous avons entre autre évalué avec succès 150 échantillons hépatiques qui ont été largement caractérisés pour plusieurs phénotypes. Dans ces échantillons, nous avons pu valider 13 gènes ADME avec cis-eQTL précédemment rapportés et de découvrir et de 13 autres gènes ADME avec cis eQTLs qui n'avaient pas été observés en utilisant des méthodes standard. Enfin, à l'appui de ce travail, un outil logiciel a été développé, Opitimus Primer, pour aider pour aider au développement du test. Le logiciel a également été utilisé pour aider à l'enrichissement de cibles génomiques pour d'expériences séquençage. Le contenu ainsi que la conception, l’optimisation et la validation de notre panel le distingue largement de l’ensemble des essais commerciaux couramment disponibles sur le marché qui comprennent soit des marqueurs fonctionnels pour seulement un petit nombre de gènes, ou alors n’offre pas une couverture adéquate pour les gènes connus d’ADME. Nous pouvons ainsi conclure que l’essai que nous avons développé est et continuera certainement d’être un outil d’une grande utilité pour les futures études et essais cliniques dans le domaine de la pharmacocinétique, qui bénéficieraient de l'évaluation d'une longue liste complète de gènes d’ADME.
Resumo:
La sclérose latérale amyotrophique (SLA) est la maladie des neurones moteurs la plus fréquente, affectant 4-6 individus par 100,000 habitants à l’échelle mondiale. La maladie se caractérise par une faiblesse et une atrophie musculaire suite à la dégénérescence des neurones du cortex moteur, tronc cérébral et moelle épinière. Les personnes atteintes développent les premiers symptômes à l’âge adulte et la maladie progresse sur une période de trois à cinq ans. Il a été répertorié qu’environ 10% des patients ont une histoire familiale de SLA; 90% des gens affectés le sont donc de façon sporadique. La découverte il y a 19 ans de mutations dans le gène zinc/copper superoxide dismutase (SOD1), présentes dans 15-20% des cas familiaux de SLA et environ 2% du total des individus affectés, a été l’événement déclencheur pour la découverte de variations génétiques responsables de la maladie. La recherche sur la génétique de la SLA a connu une progression rapide ces quatre dernières années avec l’identification de mutations dans de nouveaux gènes. Toutefois, même si certains de ces gènes ont été démontrés comme réellement liés à la maladie, la contribution d’autres gènes demeure incertaine puisque les résultats publiés de ceux-ci n’ont pas, à ce jour, été répliqués. Une portion substantielle de cas reste cependant à être génétiquement expliquée, et aucun traitement à ce jour n’a été démontré comme étant efficace pour remédier, atténuer ou prévenir la maladie. Le but du projet de recherche de doctorat était d’identifier de nouveaux gènes mutés dans la SLA, tout en évaluant la contribution de gènes nouvellement identifiés chez une importante cohorte multiethnique de cas familiaux et sporadiques. Les résultats présentés sont organisés en trois sections différentes. Dans un premier temps, la contribution de mutations présentes dans le gène FUS est évaluée chez les patients familiaux, sporadiques et juvéniles de SLA. Précisément, de nouvelles mutations sont rapportées et la proportion de mutations retrouvées chez les cas familiaux et sporadiques de SLA est évaluée. De plus, une nouvelle mutation est rapportée dans un cas juvénile de SLA; cette étude de cas est discutée. Dans un deuxième temps, de nouvelles avenues génétiques sont explorées concernant le gène SOD1. En effet, une nouvelle mutation complexe est rapportée chez une famille française de SLA. De plus, la possibilité qu’une mutation présente dans un autre gène impliqué dans la SLA ait un impact sur l’épissage du gène SOD1 est évaluée. Finalement, la dernière section explique la contribution de nouveaux gènes candidats chez les patients atteints de SLA. Spécifiquement, le rôle des gènes OPTN, SIGMAR1 et SORT1 dans le phénotype de SLA est évalué. Il est souhaité que nos résultats combinés avec les récents développements en génétique et biologie moléculaire permettent une meilleure compréhension du mécanisme pathologique responsable de cette terrible maladie tout en guidant le déploiement de thérapies suite à l’identification des cibles appropriées.
Resumo:
La leucémie lymphoïde représente environ 30% des cas de cancer chez l’enfant. Elle est souvent causée par des réarrangements chromosomiques impliquant des gènes encodant des facteurs de transcription, qui contrôlent des programmes génétiques complexes. Par exemple, LMO2 (LIM-only 2) est un facteur de transcription oncogénique fréquemment exprimé de façon aberrante dans les leucémies lymphoblastiques aigues des cellules T (T-ALL). Dans l’hématopoïèse normale, LMO2 est essentiel à la génération des cellules souches hématopoïétiques à l’origine de toutes les cellules sanguines. D’ailleurs, certaines cellules leucémiques possèdent des propriétés normalement réservées aux cellules souches hématopoïétiques. Ainsi, l’étude de la fonction de LMO2 dans les cellules souches hématopoïétiques peut être pertinente autant dans le contexte hématopoïétique normal que leucémique. Afin de mettre en évidence de nouvelles fonctions moléculaires pour LMO2, j’ai choisi d’identifier les protéines qui s’y associent. En plus de ses partenaires connus, j’ai identifié plusieurs protéines de transcription/remodelage de la chromatine, en accord avec son rôle transcriptionnel. Plusieurs nouvelles fonctions potentielles ont été révélées, indiquant que cette protéine adaptatrice pourrait faire partie de complexes non transcriptionnels, régulant d’autres processus cellulaires. Les oncogènes comme LMO2 pourraient être des régulateurs à large spectre. Particulièrement, j’ai identifié des interactions entre LMO2 et des protéines de réplication de l’ADN. J’ai montré que LMO2 contrôle la réplication de l’ADN dans les cellules hématopoïétiques, et possiblement durant la leucémogenèse, indépendamment de son rôle transcriptionnel. Ensemble, ces études ont donc permis de révéler de nouvelles fonctions pour LMO2, et pourraient servir de paradigme pour d’autres facteurs de transcription oncogéniques, particulièrement aux autres protéines de la famille LMO, qui sont aussi des oncogènes puissants.
Resumo:
L’adénovirus a été étudié dans l’optique de développer de nouveaux traitements pour différentes maladies. Les vecteurs adénoviraux (AdV) sont des outils intéressants du fait qu’ils peuvent être produits en grandes quantités (1X1012 particules par millilitre) et de par leur capacité à infecter des cellules quiescentes ou en division rapide. Les AdVs ont subi bon nombre de modifications pour leur permettre de traiter des cellules tumorales ou pour transporter des séquences génétiques exogènes essentielles pour le traitement de maladies monogéniques. Toutefois, les faibles niveaux d’expression du récepteur primaire de l’adénovirus, le CAR (récepteur à l’adénovirus et au virus coxsackie), réduit grandement l’efficacité de transduction dans plusieurs tumeurs. De plus, certains tissus normaux comme les muscles n’expriment que très peu de CAR, rendant l’utilisation des AdVs moins significative. Pour pallier à cette limitation, plusieurs modifications ont été générées sur les capsides virales. L’objectif de ces modifications était d’augmenter l’affinité des AdVs pour des récepteurs cellulaires spécifiques surexprimés dans les tumeurs et qui seraient exempts dans les tissus sains avoisinant. On peut mentionner dans les approches étudiées: l’utilisation de ligands bispécifiques, l’incorporation de peptides dans différentes régions de la fibre ou la substitution par une fibre de sérotypes différents. Notre hypothèse était que les domaines d’interaction complémentaire (K-Coil et ECoil) permettraient aux ligands de s’associer aux particules virales et d’altérer le tropisme de l’AdV. Pour ce faire, nous avons inclus un domaine d’interaction synthétique, le K-Coil,dans différentes régions de la fibre virale en plus de générer des mutations spécifiques pour abolir le tropisme naturel. Pour permettre la liaison avec les récepteurs d’intérêt dont l’EGF-R, l’IGF-IR et le CEA6, nous avons fusionné le domaine d’interaction complémentaire, le E-Coil, soit dans les ligands des récepteurs ciblés dont l’EGF et l’IGF-I, soit sur un anticorps à un seul domaine reconnaissant la protéine membranaire CEA6, l’AFAI. Suite à la construction des différents ligands de même que des différentes fibres virales modifiées, nous avons determiné tout d’abord que les différents ligands de même que les virus modifiés pouvaient être produits et que les différentes composantes pouvaient interagir ensemble. Les productions virales ont été optimisées par l’utilisation d’un nouveau protocole utilisant l’iodixanol. Ensuite, nous avons démontré que l’association des ligands avec le virus arborant une fibre modifiée pouvait entraîner une augmentation de transduction de 2 à 21 fois dans différentes lignées cellulaires. À cause de la difficulté des adénovirus à infecter les fibres musculaires occasionnée par l’absence du CAR, nous avons cherché à savoir si le changement de tropisme pourrait accroître l’infectivité des AdVs. Nous avons démontré que l’association avec le ligand bispécifique IGF-E5 permettait d’accroître la transduction autant dans les myoblastes que dans les myotubes de souris. Nous avons finalement réussi à démontrer que notre système pouvait induire une augmentation de 1,6 fois de la transduction suite à l’infection des muscles de souriceaux MDX. Ces résultats nous amènent à la conclusion que le système est fonctionnel et qu’il pourrait être évalué dans des AdVs encodant pour différents gènes thérapeutiques.
Resumo:
Les copulas archimédiennes hiérarchiques ont récemment gagné en intérêt puisqu’elles généralisent la famille de copules archimédiennes, car elles introduisent une asymétrie partielle. Des algorithmes d’échantillonnages et des méthodes ont largement été développés pour de telles copules. Néanmoins, concernant l’estimation par maximum de vraisemblance et les tests d’adéquations, il est important d’avoir à disposition la densité de ces variables aléatoires. Ce travail remplie ce manque. Après une courte introduction aux copules et aux copules archimédiennes hiérarchiques, une équation générale sur les dérivées des noeuds et générateurs internes apparaissant dans la densité des copules archimédiennes hiérarchique. sera dérivée. Il en suit une formule tractable pour la densité des copules archimédiennes hiérarchiques. Des exemples incluant les familles archimédiennes usuelles ainsi que leur transformations sont présentés. De plus, une méthode numérique efficiente pour évaluer le logarithme des densités est présentée.
Resumo:
Afin d'enrichir les données de corpus bilingues parallèles, il peut être judicieux de travailler avec des corpus dits comparables. En effet dans ce type de corpus, même si les documents dans la langue cible ne sont pas l'exacte traduction de ceux dans la langue source, on peut y retrouver des mots ou des phrases en relation de traduction. L'encyclopédie libre Wikipédia constitue un corpus comparable multilingue de plusieurs millions de documents. Notre travail consiste à trouver une méthode générale et endogène permettant d'extraire un maximum de phrases parallèles. Nous travaillons avec le couple de langues français-anglais mais notre méthode, qui n'utilise aucune ressource bilingue extérieure, peut s'appliquer à tout autre couple de langues. Elle se décompose en deux étapes. La première consiste à détecter les paires d’articles qui ont le plus de chance de contenir des traductions. Nous utilisons pour cela un réseau de neurones entraîné sur un petit ensemble de données constitué d'articles alignés au niveau des phrases. La deuxième étape effectue la sélection des paires de phrases grâce à un autre réseau de neurones dont les sorties sont alors réinterprétées par un algorithme d'optimisation combinatoire et une heuristique d'extension. L'ajout des quelques 560~000 paires de phrases extraites de Wikipédia au corpus d'entraînement d'un système de traduction automatique statistique de référence permet d'améliorer la qualité des traductions produites. Nous mettons les données alignées et le corpus extrait à la disposition de la communauté scientifique.
Resumo:
L'ostéoarthrose (OA) est la forme la plus commune d’arthrite et son étiologie demeure encore méconnue. Les travaux du Dr Moreau et son équipe ont permis de mettre en évidence une quasi perte d’expression du facteur de transcription Pitx1 dans les chondrocytes OA et la protéine PHB-1 a été identifiée comme étant membre d’un complexe répresseur pouvant lier le promoteur de Pitx1. Le but de la présente étude était de confirmer l’accumulation anormale de PHB-1 dans le noyau des chondrocytes OA, tel que suggéré par des données préliminaires, et d’identifier les mécanismes impliqués dans son import ou rétention au noyau. Pour ce faire, un volet mécanistique utilisant les lignées C28/I2 et U2OS fut combiné à l’étude clinique des chondrocytes articulaires de patients OA et de sujets sains. Les résultats de cette étude démontrent que chez 55 pourcent des patients OA, la Prohibitine s’accumule dans le noyau des chondrocytes articulaires et que cette accumulation corrèle avec une augmentation de la sumoylation totale dans le noyau des cellules OA. Le présent projet de recherche propose pour la première fois qu’une sumoylation accrue au sein des cellules OA pourrait être responsable de l’accumulation nucléaire de PHB-1, médiée par sa liaison aux protéines SUMO-1 via un domaine de liaison aux SUMOs (SBM) localisé aux résidus 76 à 79 de PHB-1. Les résultats de cette étude ont aussi permis de mettre en évidence que dans les chondrocytes OA, les protéines SUMO-1 et SUMO-2/3 s’accumulent dans des corps nucléaires de type PML, suggérant un recrutement de protéines interagissant avec les SUMOs au sein de ces structures dans les cellules OA. Nous sommes persuadés que cette étude générera des retombées importantes non seulement au niveau fondamental pour la compréhension des mécanismes moléculaires liés à la biologie des chondrocytes articulaires, mais aussi au niveau du développement d’outils génétiques permettant le dépistage de l’arthrose à un stade précoce.
Resumo:
La malformation de Chiari type 1 (MCI) est une anomalie congénitale de la jonction cranio-cérébrale fréquente avec une incidence de 1:1280. MCI est caractérisée par la descente des amygdales cérébelleuses à travers le foramen magnum et est souvent associée à la syringomyélie. Les causes de cette maladie semblent être multifactorielles incluant des facteurs génétiques. La MCI est similaire à une malformation fréquente chez la race des Griffon Bruxellois (GB) connue sous le nom de Malformation Chiari-like (MCL). Le modèle canin offre l’avantage d’une forte homogénéité génétique réduisant ainsi la complexité de la maladie et facilitant l’identification d’un locus causatif. Une étude d’association du génome entier sur une cohorte de 56 GB suivie d’une cartographie fine sur une cohorte de 217 GB a identifié un locus fortement associé à la MCL sur le chromosome 2 (22 SNPs, valeur P= 7 x 10-8) avec un haplotype de 1.9 Mb plus fréquent chez les non affectés. Une seconde étude d’association du génome entier sur une cohorte de 113 GB a permis d’identifier un 2 ème locus fortement associé à la MCL sur le chromosome 13 (25 SNPs , valeur P= 3 x 10 -7) avec un haplotype de 4 Mb surreprésenté chez les non affectés. Ces régions candidates constituent la première étape vers l’identification de gènes causatifs pour la MCL. Notre étude offre un point d’entrée vers une meilleure compréhension des mécanismes moléculaires sous-tendant la pathogénèse de la MCI humaine.
Resumo:
Malgré des progrès constants en termes de capacité de calcul, mémoire et quantité de données disponibles, les algorithmes d'apprentissage machine doivent se montrer efficaces dans l'utilisation de ces ressources. La minimisation des coûts est évidemment un facteur important, mais une autre motivation est la recherche de mécanismes d'apprentissage capables de reproduire le comportement d'êtres intelligents. Cette thèse aborde le problème de l'efficacité à travers plusieurs articles traitant d'algorithmes d'apprentissage variés : ce problème est vu non seulement du point de vue de l'efficacité computationnelle (temps de calcul et mémoire utilisés), mais aussi de celui de l'efficacité statistique (nombre d'exemples requis pour accomplir une tâche donnée). Une première contribution apportée par cette thèse est la mise en lumière d'inefficacités statistiques dans des algorithmes existants. Nous montrons ainsi que les arbres de décision généralisent mal pour certains types de tâches (chapitre 3), de même que les algorithmes classiques d'apprentissage semi-supervisé à base de graphe (chapitre 5), chacun étant affecté par une forme particulière de la malédiction de la dimensionalité. Pour une certaine classe de réseaux de neurones, appelés réseaux sommes-produits, nous montrons qu'il peut être exponentiellement moins efficace de représenter certaines fonctions par des réseaux à une seule couche cachée, comparé à des réseaux profonds (chapitre 4). Nos analyses permettent de mieux comprendre certains problèmes intrinsèques liés à ces algorithmes, et d'orienter la recherche dans des directions qui pourraient permettre de les résoudre. Nous identifions également des inefficacités computationnelles dans les algorithmes d'apprentissage semi-supervisé à base de graphe (chapitre 5), et dans l'apprentissage de mélanges de Gaussiennes en présence de valeurs manquantes (chapitre 6). Dans les deux cas, nous proposons de nouveaux algorithmes capables de traiter des ensembles de données significativement plus grands. Les deux derniers chapitres traitent de l'efficacité computationnelle sous un angle différent. Dans le chapitre 7, nous analysons de manière théorique un algorithme existant pour l'apprentissage efficace dans les machines de Boltzmann restreintes (la divergence contrastive), afin de mieux comprendre les raisons qui expliquent le succès de cet algorithme. Finalement, dans le chapitre 8 nous présentons une application de l'apprentissage machine dans le domaine des jeux vidéo, pour laquelle le problème de l'efficacité computationnelle est relié à des considérations d'ingénierie logicielle et matérielle, souvent ignorées en recherche mais ô combien importantes en pratique.
Resumo:
La phosphorylation est une modification post-traductionnelle modulant l’activité, la conformation ou la localisation d’une protéine et régulant divers processus. Les kinases et phosphatases sont responsables de la dynamique de phosphorylation et agissent de manière coordonnée. L’activation anormale ou la dérégulation de kinases peuvent conduire au développement de cancers ou de désordres métaboliques. Les récepteurs tyrosine kinase (RTKs) sont souvent impliqués dans des maladies et la compréhension des mécanismes régissant leur régulation permet de déterminer les effets anticipés sur leurs substrats. Dans ce contexte, le but de cette thèse est d’identifier les évènements de phosphorylation intervenant dans la voie de l’insuline chez la drosophile impliquant un RTK : le récepteur de l’insuline (InR). La cascade de phosphorylation déclenchée suite à l’activation du récepteur est conservée chez le mammifère. Afin d’étudier le phosphoprotéome de cellules S2 de drosophile, nous avons utilisé une étape d’enrichissement de phosphopeptides sur dioxyde de titane suivie de leur séparation par chromatographie liquide (LC) et mobilité ionique (FAIMS). Les phosphopeptides sont analysés par spectrométrie de masse en tandem à haute résolution. Nous avons d’abord démontré les bénéfices de l’utilisation du FAIMS comparativement à une étude conventionnelle en rapportant une augmentation de 50 % dans le nombre de phosphopeptides identifiés avec FAIMS. Cette technique permet de séparer des phosphoisomères difficilement distinguables par LC et l’acquisition de spectres MS/MS distincts où la localisation précise du phosphate est déterminée. Nous avons appliqué cette approche pour l’étude des phosphoprotéomes de cellules S2 contrôles ou traitées à l’insuline et avons identifié 32 phosphopeptides (sur 2 660 quantifiés) pour lesquels la phosphorylation est modulée. Étonnamment, 50 % des cibles régulées possèdent un site consensus pour la kinase CK2. Une stratégie d’inhibition par RNAi a été implémentée afin d’investiguer le rôle de CK2 dans la voie de l’insuline. Nous avons identifié 6 phosphoprotéines (CG30085, su(var)205, scny, protein CDV3 homolog, D1 et mu2) positivement régulées suite à l’insuline et négativement modulées après le traitement par RNAi CK2. Par essai kinase in vitro, nous avons identifié 29 cibles directes de CK2 dont 15 corrélaient avec les résultats obtenus par RNAi. Nous avons démontré que la phosphorylation de su(var)205 (S15) était modulée par l’insuline en plus d’être une cible directe de CK2 suite à l’expérience RNAi et à l’essai kinase. L’analyse des données phosphoprotéomiques a mis en évidence des phosphopeptides isomériques dont certains étaient séparables par FAIMS. Nous avons déterminé leur fréquence lors d’études à grande échelle grâce à deux algorithmes. Le script basé sur les différences de temps de rétention entre isomères a identifié 64 phosphoisomères séparés par LC chez la souris et le rat (moins de 1 % des peptides identifiés). Chez la drosophile, 117 ont été répertoriés en combinaison avec une approche ciblée impliquant des listes d’inclusion. Le second algorithme basé sur la présence d’ions caractéristiques suite à la fragmentation de formes qui co-éluent a rapporté 23 paires isomériques. L’importance de pouvoir distinguer des phosphoisomères est capitale dans le but d’associer une fonction biologique à un site de phosphorylation précis qui doit être identifié avec confiance.
Resumo:
Les titres financiers sont souvent modélisés par des équations différentielles stochastiques (ÉDS). Ces équations peuvent décrire le comportement de l'actif, et aussi parfois certains paramètres du modèle. Par exemple, le modèle de Heston (1993), qui s'inscrit dans la catégorie des modèles à volatilité stochastique, décrit le comportement de l'actif et de la variance de ce dernier. Le modèle de Heston est très intéressant puisqu'il admet des formules semi-analytiques pour certains produits dérivés, ainsi qu'un certain réalisme. Cependant, la plupart des algorithmes de simulation pour ce modèle font face à quelques problèmes lorsque la condition de Feller (1951) n'est pas respectée. Dans ce mémoire, nous introduisons trois nouveaux algorithmes de simulation pour le modèle de Heston. Ces nouveaux algorithmes visent à accélérer le célèbre algorithme de Broadie et Kaya (2006); pour ce faire, nous utiliserons, entre autres, des méthodes de Monte Carlo par chaînes de Markov (MCMC) et des approximations. Dans le premier algorithme, nous modifions la seconde étape de la méthode de Broadie et Kaya afin de l'accélérer. Alors, au lieu d'utiliser la méthode de Newton du second ordre et l'approche d'inversion, nous utilisons l'algorithme de Metropolis-Hastings (voir Hastings (1970)). Le second algorithme est une amélioration du premier. Au lieu d'utiliser la vraie densité de la variance intégrée, nous utilisons l'approximation de Smith (2007). Cette amélioration diminue la dimension de l'équation caractéristique et accélère l'algorithme. Notre dernier algorithme n'est pas basé sur une méthode MCMC. Cependant, nous essayons toujours d'accélérer la seconde étape de la méthode de Broadie et Kaya (2006). Afin de réussir ceci, nous utilisons une variable aléatoire gamma dont les moments sont appariés à la vraie variable aléatoire de la variance intégrée par rapport au temps. Selon Stewart et al. (2007), il est possible d'approximer une convolution de variables aléatoires gamma (qui ressemble beaucoup à la représentation donnée par Glasserman et Kim (2008) si le pas de temps est petit) par une simple variable aléatoire gamma.