908 resultados para Non-dominated sorting genetic algorithms
Resumo:
Ordered gene problems are a very common classification of optimization problems. Because of their popularity countless algorithms have been developed in an attempt to find high quality solutions to the problems. It is also common to see many different types of problems reduced to ordered gene style problems as there are many popular heuristics and metaheuristics for them due to their popularity. Multiple ordered gene problems are studied, namely, the travelling salesman problem, bin packing problem, and graph colouring problem. In addition, two bioinformatics problems not traditionally seen as ordered gene problems are studied: DNA error correction and DNA fragment assembly. These problems are studied with multiple variations and combinations of heuristics and metaheuristics with two distinct types or representations. The majority of the algorithms are built around the Recentering- Restarting Genetic Algorithm. The algorithm variations were successful on all problems studied, and particularly for the two bioinformatics problems. For DNA Error Correction multiple cases were found with 100% of the codes being corrected. The algorithm variations were also able to beat all other state-of-the-art DNA Fragment Assemblers on 13 out of 16 benchmark problem instances.
Resumo:
A complex network is an abstract representation of an intricate system of interrelated elements where the patterns of connection hold significant meaning. One particular complex network is a social network whereby the vertices represent people and edges denote their daily interactions. Understanding social network dynamics can be vital to the mitigation of disease spread as these networks model the interactions, and thus avenues of spread, between individuals. To better understand complex networks, algorithms which generate graphs exhibiting observed properties of real-world networks, known as graph models, are often constructed. While various efforts to aid with the construction of graph models have been proposed using statistical and probabilistic methods, genetic programming (GP) has only recently been considered. However, determining that a graph model of a complex network accurately describes the target network(s) is not a trivial task as the graph models are often stochastic in nature and the notion of similarity is dependent upon the expected behavior of the network. This thesis examines a number of well-known network properties to determine which measures best allowed networks generated by different graph models, and thus the models themselves, to be distinguished. A proposed meta-analysis procedure was used to demonstrate how these network measures interact when used together as classifiers to determine network, and thus model, (dis)similarity. The analytical results form the basis of the fitness evaluation for a GP system used to automatically construct graph models for complex networks. The GP-based automatic inference system was used to reproduce existing, well-known graph models as well as a real-world network. Results indicated that the automatically inferred models exemplified functional similarity when compared to their respective target networks. This approach also showed promise when used to infer a model for a mammalian brain network.
Resumo:
Le cancer du sein (CS) est la deuxième cause de décès liés au cancer parmi les femmes dans la plupart des pays industrialisés. Les personnes qui ont le CS peuvent ne pas hériter des mutations causant le cancer de leurs parents. Ainsi, certaines cellules subissent des mutations qui mènent au cancer. Dans le cas de cancer héréditaire, les cellules tumorales contiennent généralement des mutations qui ne sont pas trouvées ailleurs dans l'organisme, mais peuvent maintenir des mutations qui vont répartir dans toutes les cellules. La genèse du CS est le résultat des mutations de gènes qui assurent la régulation de la prolifération cellulaire et la réparation de l’ADN. Deux gènes semblent particulièrement concernés par les mutations. Les gènes ‘Breast Cancer 1’ (BRCA1) et ‘Breast Cancer 2’ (BRCA2), sont impliqués dans la prédisposition génétique de CS. On estime que 5-10% des cas de cancer du sein sont attribuables à une prédisposition génétique. La plupart de ces cancers sont liés à une anomalie du gène BRCA1 ou BRCA2. Plusieurs études ont été menées chez les femmes atteintes de CS sporadique et quelques études se sont concentrées sur celles qui sont porteuses de mutations de BRCA. Alors, notre recherche a été entreprise afin de vérifier l’hypothèse d’une association entre le CS, le mode vie et les habitudes alimentaires chez les Canadiennes-françaises non porteuses des 6 mutations de BRCA les plus fréquentes parmi cette population. Nous avons mené une étude cas-témoins dans cette population. Quelque 280 femmes atteintes du cancer du sein et non-porteuses de mutations de BRCA, ont été recrutées en tant que cas. Les témoins étaient recrutés parmi les membres de la famille des cas (n=15) ou à partir d'autres familles atteintes de CS (n=265). Les participantes étaient de tous âges, recrutées à partir d’une étude de cohorte qui est actuellement en cours, menée par une équipe de chercheurs au Centre Hospitalier Universitaire de Montréal (CHUM) Hôtel-Dieu à Montréal. Les apports alimentaires ont été recueillis par un questionnaire de fréquence semi-quantitatif validé et administré par une nutritionniste, qui portait sur la période avant les deux ans précédant le premier diagnostic de CS pour les cas et la période avant les deux ans précédant l’entrevue téléphonique pour les témoins. Un questionnaire de base était administré par l’infirmière de recherche aux participantes afin de colliger des renseignements sociodémographiques et sur les facteurs de risque du CS. Une association positive et significative a été détectée entre l’âge (plus de 50 ans) auquel les sujets avaient atteint leur Indice de Masse Corporel (IMC) le plus élevé et le CS rapport de cotes (OR) =2,83; intervalle de confiance à 95% (IC95%) (2,34-2,91). De plus, une association positive a été détectée entre un gain de poids de >34 lbs comparativement à un gain de poids de ≤15 lbs, dès l’âge de 20 ans OR=1,68; IC95% (1,10-2,58). Un gain de poids de >24 lbs comparativement à un gain de poids de ≤9 lbs, dès l’âge de 30 ans a aussi montré une augmentation de risque de CS OR=1,96; IC95% (1,46-3,06). Une association positive a aussi été détecté entre, un gain de poids de >12 lbs comparativement à un gain de poids de ≤1 lb, dès l’âge de 40 ans OR=1,91; IC95% (1,53-2,66). Concernant le tabagisme, nous avons observé une association positive et significative reliée à la consommation de plus de 9 paquets-années OR = 1,59; IC95% (1,57-2,87). Il fut suggéré que l’activité physique modéré confère une protection contre le CS: une pratique de > 24,8 (‘metabolic equivalent’) MET-hrs par semaine par rapport à ≤10,7 MET-hrs par semaine, diminue le risque du CS de 52% OR = 0,48 ; IC95% (0,31-0,74). L’activité physique totale (entre 16,2 et 33,2 MET-hrs par semaine), a aussi montré une réduction de risque de CS de 43% OR = 0,57 ; IC95% (0,37-0,87). Toutefois, il n'y avait aucune association entre une activité physique vigoureuse et le risque de CS. L’analyse portant sur les macro- et micro-nutriments et les groupes alimentaires a montré qu’un apport en énergie totale de plus de 2057 Kcal par jour augmentait le risque de CS de 2,5 fois OR = 2,54; IC95% (1,67-3,84). En ce qui concerne la consommation de café, les participantes qui buvaient plus de 8 tasses de café par jour avaient un risque de CS augmenté de 40% OR = 1,40; IC95% (1,09-2,24). Les sujets ayant une consommation dépassant 9 g d’alcool (éthanol) par jour avaient également un risque élevé de 55% OR = 1,55; IC95% (1,02-2,37). De plus, une association positive et significative a été détectée entre le CS et la consommation de plus de deux bouteilles de bière par semaine OR = 1,34; IC95% (1,28-2,11), 10 onces de vin par semaine OR = 1,16; IC95% (1,08-2,58) ou 6 onces de spiritueux par semaine OR = 1,09; IC95% (1,02-2,08), respectivement. En résumé, les résultats de cette recherche supportent l’hypothèse selon laquelle le mode de vie et les habitudes alimentaires jouent un rôle important dans l’étiologie de CS chez les Canadiennes-françaises non porteuses de mutations de BRCA. Les résultats nous permettent de constater que le gain de poids et le tabagisme sont liés à des risques élevés de CS, tandis que l'activité physique modérée aide à réduire ce risque. De plus, nos résultats suggèrent qu’un apport énergétique total relativement élevé et une consommation élevée de café et d'alcool peuvent accroître le risque de ce cancer. Ce travail a permis de mettre l’accent sur une nouvelle direction de recherche, jusqu'à présent non investiguée. Les résultats de ce travail de recherche pourraient contribuer à recueillir de nouvelles informations et des conseils pouvant influencer et aider la population à modifier son mode de vie et ses habitudes alimentaires afin de diminuer le risque de cancer du sein.
Resumo:
La bio-informatique est un champ pluridisciplinaire qui utilise la biologie, l’informatique, la physique et les mathématiques pour résoudre des problèmes posés par la biologie. L’une des thématiques de la bio-informatique est l’analyse des séquences génomiques et la prédiction de gènes d’ARN non codants. Les ARN non codants sont des molécules d’ARN qui sont transcrites mais pas traduites en protéine et qui ont une fonction dans la cellule. Trouver des gènes d’ARN non codants par des techniques de biochimie et de biologie moléculaire est assez difficile et relativement coûteux. Ainsi, la prédiction des gènes d’ARNnc par des méthodes bio-informatiques est un enjeu important. Cette recherche décrit un travail d’analyse informatique pour chercher des nouveaux ARNnc chez le pathogène Candida albicans et d’une validation expérimentale. Nous avons utilisé comme stratégie une analyse informatique combinant plusieurs logiciels d’identification d’ARNnc. Nous avons validé un sous-ensemble des prédictions informatiques avec une expérience de puces à ADN couvrant 1979 régions du génome. Grace à cette expérience nous avons identifié 62 nouveaux transcrits chez Candida albicans. Ce travail aussi permit le développement d’une méthode d’analyse pour des puces à ADN de type tiling array. Ce travail présente également une tentation d’améliorer de la prédiction d’ARNnc avec une méthode se basant sur la recherche de motifs d’ARN dans les séquences.
Resumo:
Introduction: L'homéostasie du cholestérol est indispensable à la synthèse de la testostérone dans le tissu interstitiel et la production de gamètes mâles fertiles dans les tubules séminifères. Les facteurs enzymatiques contribuent au maintien de cet équilibre intracellulaire du cholestérol. L'absence d'un ou de plusieurs enzymes telles que la HMG-CoA réductase, la HSL et l'ACAT-1 a été associée à l'infertilité masculine. Toutefois, les facteurs enzymatiques qui contribuent au maintien de l'équilibre intra-tissulaire du cholestérol n'ont pas été étudiés. Cette étude a pour but de tester l'hypothèse que le maintien des taux de cholestérol compatibles avec la spermatogenèse nécessite une coordination de la fonction intracellulaire des enzymes HMG-CoA réductase, ACAT1 et ACAT2 et la HSL. Méthodes: Nous avons analysé l'expression de l’ARNm et de la protéine de ces enzymes dans les fractions enrichies en tubules séminifères (STf) de vison durant le développement postnatal et le cycle reproductif annuel et dans les fractions enrichies en tissu interstitiel (ITf) et de STf durant le développement postnatal chez la souris. Nous avons développé deux nouvelles techniques pour la mesure de l'activité enzymatique de la HMG-CoA réductase et de celle de l'ACAT1 et ACAT2. En outre, l'immunohistochimie a été utilisée pour localiser les enzymes dans le testicule. Enfin, les souris génétiquement déficientes en HSL, en SR-BI et en CD36 ont été utilisées pour élucider la contribution de la HMG-CoA réductase, l'ACAT1 et l'ACAT2 et la HSL à l'homéostasie du cholestérol. Résultats: 1) HMG-CoA réductase: (Vison) La variation du taux d’expression de l’ARNm de la HMG-CoA réductase était corrélée à celle de l'isoforme de 90 kDa de la protéine HMG-CoA réductase durant le développement postnatal et chez l'adulte durant le cycle reproductif saisonnier. L'activité enzymatique de la HMG-CoA réductase augmentait de façon concomitante avec le taux protéinique pour atteindre son niveau le plus élevé à 240 jours (3.6411e-7 mol/min/μg de protéines) au cours du développement et en Février (1.2132e-6 mol/min/μg de protéines) durant le cycle reproductif chez l’adulte. (Souris), Les niveaux d'expression de l'ARNm et l'activité enzymatique de la HMG-CoA réductase étaient maximales à 42 jours. A l'opposé, le taux protéinique diminuait au cours du développement. 2) HSL: (Vison), l'expression de la protéine de 90 kDa de la HSL était élevée à 180- et 240 jours après la naissance, ainsi qu'en Janvier durant le cycle saisonnier chez l'adulte. L'activité enzymatique de la HSL augmentait durant le développement pour atteindre un pic à 270 jours (36,45 nM/min/μg). Chez l'adulte, l'activité enzymatique de la HSL était maximale en Février. (Souris) Le niveau d’expression de l'ARNm de la HSL augmentait significativement à 21-, 28- et 35 jours après la naissance concomitamment avec le taux d'expression protéinique. L'activité enzymatique de la HSL était maximale à 42 jours suivie d'une baisse significative chez l'adulte. 3) ACAT-1 et ACAT-2: Le présent rapport est le premier à identifier l’expression de l'ACAT-1 et de l'ACAT-2 dans les STf de visons et de souris. (Vison) L'activité enzymatique de l'ACAT-2 était maximale à la complétion du développement à 270 jour (1190.00 CPMB/200 μg de protéines) et en janvier (2643 CPMB/200 μg de protéines) chez l'adulte. En revanche, l'activité enzymatique de l'ACAT-1 piquait à 90 jours et en août respectivement durant le développement et chez l'adulte. (Souris) Les niveaux d'expression de l'ARNm et la protéine de l'ACAT-1 diminuait au cours du développement. Le taux de l'ARNm de l'ACAT-2, à l’opposé du taux protéinique, augmentait au cours du développement. L'activité enzymatique de l'ACAT-1 diminuait au cours du développement tandis que celle de l'ACAT-2 augmentait pour atteindre son niveau maximal à 42 jours. 4) Souris HSL-/ -: Le taux d’expression de l'ARNm et l'activité enzymatique de la HMG-CoA réductase diminuaient significativement dans les STf de souris HSL-/- comparés aux souris HSL+/+. Par contre, les taux de l'ARNm et les niveaux des activités enzymatiques de l'ACAT-1 et de l'ACAT-2 étaient significativement plus élevés dans les STf de souris HSL-/- comparés aux souris HSL+/+ 5) Souris SR-BI-/-: L'expression de l'ARNm et l'activité enzymatique de la HMG-CoA réductase et de l'ACAT-1 étaient plus basses dans les STf de souris SR-BI-/- comparées aux souris SR-BI+/+. A l'opposé, le taux d'expression de l'ARNm et l'activité enzymatique de la HSL étaient augmentées chez les souris SR-BI-/- comparées aux souris SR-BI+/+. 6) Souris CD36-/-: L'expression de l'ARNm et l'activité enzymatique de la HMG-CoA réductase et de l'ACAT-2 étaient significativement plus faibles tandis que celles de la HSL et de l'ACAT-1 étaient inchangées dans les STf de souris CD36-/- comparées aux souris CD36+/+. Conclusion: Nos résultats suggèrent que: 1) L'activité enzymatique de la HMG-CoA réductase et de la HSL sont associées à l'activité spermatogénétique et que ces activités ne seraient pas régulées au niveau transcriptionnel. 2) L'ACAT-1 et de l'ACAT-2 sont exprimées dans des cellules différentes au sein des tubules séminifères, suggérant des fonctions distinctes pour ces deux isoformes: l'estérification du cholestérol libre dans les cellules germinales pour l'ACAT-1 et l'efflux du cholestérol en excès dans les cellules de Sertoli au cours de la spermatogenèse pour l'ACAT-2. 3) La suppression génétique de la HSL diminuait la HMG-CoA réductase et augmentait les deux isoformes de l'ACAT, suggérant que ces enzymes jouent un rôle critique dans le métabolisme du cholestérol intratubulaire. 4) La suppression génétique des transporteurs sélectifs de cholestérol SR-BI et CD36 affecte l'expression (ARNm et protéine) et l'activité des enzymes HMG-CoA réductase, HSL, ACAT-1 et ACAT-2, suggérant l'existence d’un effet compensatoire entre facteurs enzymatiques et non-enzymatiques du métabolisme du cholestérol dans les fractions tubulaires. Ensemble, les résultats de notre étude suggèrent que les enzymes impliquées dans la régulation du cholestérol intratubulaire agissent de concert avec les transporteurs sélectifs de cholestérol dans le but de maintenir l'homéostasie du cholestérol intra-tissulaire du testicule.
Resumo:
Les cellules gliales sont essentielles au fonctionnement du système nerveux. Dans la rétine, les cellules gliales de Müller assurent à la fois l’homéostasie du tissu et la protection des neurones, notamment celle des cellules ganglionnaires de la rétine (CGRs). L’hypothèse principale de la thèse est que les cellules de Müller joueraient un rôle primordial dans la survie neuronale tant au plan de la signalisation des neurotrophines/proneurotrophines par suite d’une blessure que lors des mécanismes d’excitotoxicité. Contrairement au brain-derived neurotrophic factor (BDNF), le nerve growth factor (NGF) n’est pas en mesure d’induire la survie des CGRs après une section du nerf optique. Le premier objectif de la thèse a donc été de localiser les récepteurs p75NTR et TrkA du NGF dans la rétine adulte et d’établir leur fonction respective en utilisant des ligands peptidomimétiques agonistes ou antagonistes spécifiques pour chacun des récepteurs. Nos résultats ont démontré que TrkA est surexprimé par les CGRs après l’axotomie, tandis que p75NTR est spécifiquement exprimé par les cellules de Müller. Alors que NGF n’est pas en mesure d’induire la survie des CGRs, l’activation spécifique de TrkA par des ligands peptidomimétique est nettement neuroprotectrice. De façon surprenante, le blocage sélectif de p75NTR ou l’absence de celui-ci protège les CGRs de la mort induite par l’axotomie. De plus, la combinaison de NGF avec l’antagoniste de p75NTR agit de façon synergique sur la survie des CGRS. Ces résultats révèlent un nouveau mécanisme par lequel le récepteur p75NTR exprimé par les cellules gliales de Müller peut grandement influencer la survie neuronale. Ensuite, nous avons voulu déterminer l’effet des proneurotrophines dans la rétine adulte. Nous avons démontré que l’injection de proNGF induit la mort des CGRs chez le rat et la souris par un mécanisme dépendant de p75NTR. L’expression de p75NTR étant exclusive aux cellules de Müller, nous avons testé l’hypothèse que le proNGF active une signalisation cellulaire non-autonome qui aboutit à la mort des CGRs. En suivant cette idée, nous avons montré que le proNGF induit une forte expression du tumor necrosis factor α (TNFα) dans les cellules de Müller et que l’inhibition du TNF bloque la mort neuronale induite par le proNGF. L’utilisation de souris knock-out pour la protéine p75NTR, son co-récepteur sortiline, ou la protéine adaptatrice NRAGE a permis de montrer que la production de TNF par les cellules gliales était dépendante de ces protéines. Le proNGF semble activer une signalisation cellulaire non-autonome qui cause la mort des neurones de façon dépendante du TNF in vivo. L’hypothèse centrale de l’excitotoxicité est que la stimulation excessive des récepteurs du glutamate sensibles au N-Methyl-D-Aspartate (NMDA) est dommageable pour les neurones et contribue à plusieurs maladies neurodégénératives. Les cellules gliales sont soupçonnées de contribuer à la mort neuronale par excitotoxicité, mais leur rôle précis est encore méconnu. Le dernier objectif de ma thèse était d’établir le rôle des cellules de Müller dans cette mort neuronale. Nos résultats ont démontré que l’injection de NMDA induit une activation du nuclear factor κB (NF-κB) dans les cellules de Müller, mais pas dans les CGRs, et que l’utilisation d’inhibiteurs du NF-κB empêche la mort des CGRs. De plus, nous avons montré que les cellules de Müller en réaction à l’activation du NF-κB produisent la protéine TNFα laquelle semble être directement impliquée dans la mort des CGRs par excitotoxicité. Cette mort cellulaire se produit principalement par l’augmentation à la surface des neurones des récepteurs AMPA perméables au Ca2+, un phénomène dépendant du TNFα. Ces donnés révèlent un nouveau mécanisme cellululaire non-autonome par lequel les cellules gliales peuvent exacerber la mort neuronale lors de la mise en jeu de mécanismes excitotoxiques.
Resumo:
On étudie l’application des algorithmes de décomposition matricielles tel que la Factorisation Matricielle Non-négative (FMN), aux représentations fréquentielles de signaux audio musicaux. Ces algorithmes, dirigés par une fonction d’erreur de reconstruction, apprennent un ensemble de fonctions de base et un ensemble de coef- ficients correspondants qui approximent le signal d’entrée. On compare l’utilisation de trois fonctions d’erreur de reconstruction quand la FMN est appliquée à des gammes monophoniques et harmonisées: moindre carré, divergence Kullback-Leibler, et une mesure de divergence dépendente de la phase, introduite récemment. Des nouvelles méthodes pour interpréter les décompositions résultantes sont présentées et sont comparées aux méthodes utilisées précédemment qui nécessitent des connaissances du domaine acoustique. Finalement, on analyse la capacité de généralisation des fonctions de bases apprises par rapport à trois paramètres musicaux: l’amplitude, la durée et le type d’instrument. Pour ce faire, on introduit deux algorithmes d’étiquetage des fonctions de bases qui performent mieux que l’approche précédente dans la majorité de nos tests, la tâche d’instrument avec audio monophonique étant la seule exception importante.
Resumo:
Depuis maintenant quelques décennies, les conseillers en génétique jouent un rôle de plus en plus important dans le domaine de la génétique médicale. Leur apport ainsi que l’importance de leur rôle sont aujourd’hui incontestables. Leur statut juridique, cependant, demeure incertain et requiert une analyse approfondie. En effet, n’étant pas reconnue par le Code des professions du Québec, la pratique du conseil génétique se trouve conséquemment privée de la protection octroyée par ce Code aux autres professionnels, notamment celle ayant trait au titre et à l’exclusivité des actes. Devant ce statu quo et dans l’optique de la protection du public, l’étude de la responsabilité civile du conseiller en génétique s’avère nécessaire. Trois obligations principales ressortent de cette analyse, soit les obligations de compétence, de renseignement et de confidentialité. En ce qui a trait aux conséquences juridiques de la non-reconnaissance, elles ne sont pas négligeables. En vérité, l’inertie du législateur québécois floue la relation qu’a le conseiller en génétique avec les autres membres de son équipe multidisciplinaire, et ce, surtout en ce qui a trait à la délimitation des actes qu’il peut prodiguer. En effet, ce dernier risque d’empiéter sur certains aspects de la pratique médicale et infirmière, engendrant ainsi sa responsabilité pénale. Finalement, il s’est avéré important de chercher des pistes de solutions étrangères pouvant se transposer au Québec. Le cas de la France se trouve à être un exemple pertinent, puisque le législateur français a reconnu législativement le conseiller en génétique en tant que professionnel et a protégé tant le titre que l’exclusivité des actes de ce dernier.
Resumo:
Les habitudes de consommation de substances psychoactives, le stress, l’obésité et les traits cardiovasculaires associés seraient en partie reliés aux mêmes facteurs génétiques. Afin d’explorer cette hypothèse, nous avons effectué, chez 119 familles multi-générationnelles québécoises de la région du Saguenay-Lac-St-Jean, des études d’association et de liaison pangénomiques pour les composantes génétiques : de la consommation usuelle d’alcool, de tabac et de café, de la réponse au stress physique et psychologique, des traits anthropométriques reliés à l’obésité, ainsi que des mesures du rythme cardiaque (RC) et de la pression artérielle (PA). 58000 SNPs et 437 marqueurs microsatellites ont été utilisés et l’annotation fonctionnelle des gènes candidats identifiés a ensuite été réalisée. Nous avons détecté des corrélations phénotypiques significatives entre les substances psychoactives, le stress, l’obésité et les traits hémodynamiques. Par exemple, les consommateurs d’alcool et de tabac ont montré un RC significativement diminué en réponse au stress psychologique. De plus, les consommateurs de tabac avaient des PA plus basses que les non-consommateurs. Aussi, les hypertendus présentaient des RC et PA systoliques accrus en réponse au stress psychologique et un indice de masse corporelle (IMC) élevé, comparativement aux normotendus. D’autre part, l’utilisation de tabac augmenterait les taux corporels d’épinéphrine, et des niveaux élevés d’épinéphrine ont été associés à des IMC diminués. Ainsi, en accord avec les corrélations inter-phénotypiques, nous avons identifié plusieurs gènes associés/liés à la consommation de substances psychoactives, à la réponse au stress physique et psychologique, aux traits reliés à l’obésité et aux traits hémodynamiques incluant CAMK4, CNTN4, DLG2, DAG1, FHIT, GRID2, ITPR2, NOVA1, NRG3 et PRKCE. Ces gènes codent pour des protéines constituant un réseau d’interactions, impliquées dans la plasticité synaptique, et hautement exprimées dans le cerveau et ses tissus associés. De plus, l’analyse des sentiers de signalisation pour les gènes identifiés (P = 0,03) a révélé une induction de mécanismes de Potentialisation à Long Terme. Les variations des traits étudiés seraient en grande partie liées au sexe et au statut d’hypertension. Pour la consommation de tabac, nous avons noté que le degré et le sens des corrélations avec l’obésité, les traits hémodynamiques et le stress sont spécifiques au sexe et à la pression artérielle. Par exemple, si des variations ont été détectées entre les hommes fumeurs et non-fumeurs (anciens et jamais), aucune différence n’a été observée chez les femmes. Nous avons aussi identifié de nombreux traits reliés à l’obésité dont la corrélation avec la consommation de tabac apparaît essentiellement plus liée à des facteurs génétiques qu’au fait de fumer en lui-même. Pour le sexe et l’hypertension, des différences dans l’héritabilité de nombreux traits ont également été observées. En effet, des analyses génétiques sur des sous-groupes spécifiques ont révélé des gènes additionnels partageant des fonctions synaptiques : CAMK4, CNTN5, DNM3, KCNAB1 (spécifique à l’hypertension), CNTN4, DNM3, FHIT, ITPR1 and NRXN3 (spécifique au sexe). Ces gènes codent pour des protéines interagissant avec les protéines de gènes détectés dans l’analyse générale. De plus, pour les gènes des sous-groupes, les résultats des analyses des sentiers de signalisation et des profils d’expression des gènes ont montré des caractéristiques similaires à celles de l’analyse générale. La convergence substantielle entre les déterminants génétiques des substances psychoactives, du stress, de l’obésité et des traits hémodynamiques soutiennent la notion selon laquelle les variations génétiques des voies de plasticité synaptique constitueraient une interface commune avec les différences génétiques liées au sexe et à l’hypertension. Nous pensons, également, que la plasticité synaptique interviendrait dans de nombreux phénotypes complexes influencés par le mode de vie. En définitive, ces résultats indiquent que des approches basées sur des sous-groupes et des réseaux amélioreraient la compréhension de la nature polygénique des phénotypes complexes, et des processus moléculaires communs qui les définissent.
Resumo:
Cette thèse traite de la résistance du VIH-1 aux antirétroviraux, en particulier de l'activité antivirale de plusieurs inhibiteurs non nucléosidiques de la transcriptase inverse (INNTI) ainsi que des inhibiteurs de protéase (IP). Nous avons exploré l’émergence et la spécificité des voies de mutations qui confèrent la résistance contre plusieurs nouveaux INNTI (étravirine (ETR) et rilpivirine (RPV)) (chapitres 2 et 3). En outre, le profil de résistance et le potentiel antirétroviral d'un nouvel IP, PL-100, est présenté dans les chapitres 4 et 5. Pour le premier projet, nous avons utilisé des sous-types B et non-B du VIH-1 pour sélectionner des virus résistants à ETR, et ainsi montré que ETR favorise l’émergence des mutations V90I, K101Q, E138K, V179D/E/F, Y181C, V189I, G190E, H221H/Y et M230L, et ce, en 18 semaines. Fait intéressant, E138K a été la première mutation à émerger dans la plupart des cas. Les clones viraux contenant E138K ont montré un faible niveau de résistance phénotypique à ETR (3,8 fois) et une diminution modeste de la capacité de réplication (2 fois) par rapport au virus de type sauvage. Nous avons également examiné les profils de résistance à ETR et RPV dans les virus contenant des mutations de résistance aux INNTI au début de la sélection. Dans le cas du virus de type sauvage et du virus contenant la mutation unique K103N, les premières mutations à apparaître en présence d’ETR ou de RPV ont été E138K ou E138G suivies d’autres mutations de résistance aux INNTI. À l’inverse, dans les mêmes conditions, le virus avec la mutation Y181C a évolué pour produire les mutations V179I/F ou A62V/A, mais pas E138K/G. L'ajout de mutations à la position 138 en présence de Y181C n'augmente pas les niveaux de résistance à ETR ou RPV. Nous avons également observé que la combinaison de Y181C et E138K peut conduire à un virus moins adapté par rapport au virus contenant uniquement Y181C. Sur la base de ces résultats, nous suggérons que les mutations Y181C et E138K peuvent être antagonistes. L’analyse de la résistance au PL-100 des virus de sous-type C et CRF01_AE dans les cellules en culture est décrite dans le chapitre 4. Le PL-100 sélectionne pour des mutations de résistance utilisant deux voies distinctes, l'une avec les mutations V82A et L90M et l'autre avec T80I, suivi de l’addition des mutations M46I/L, I54M, K55R, L76F, P81S et I85V. Une accumulation d'au moins trois mutations dans le rabat protéique et dans le site actif est requise dans chaque cas pour qu’un haut niveau de résistance soit atteint, ce qui démontre que le PL-100 dispose d'une barrière génétique élevée contre le développement de la résistance. Dans le chapitre 5, nous avons évalué le potentiel du PL-100 en tant qu’inhibiteur de protéase de deuxième génération. Les virus résistants au PL-100 émergent en 8-48 semaines alors qu’aucune mutation n’apparaît avec le darunavir (DRV) sur une période de 40 semaines. La modélisation moléculaire montre que la haute barrière génétique du DRV est due à de multiples interactions avec la protéase dont des liaison hydrogènes entre les groupes di-tétrahydrofuranne (THF) et les atomes d'oxygène des acides aminés A28, D29 et D30, tandis que la liaison de PL-100 est principalement basée sur des interactions polaires et hydrophobes délocalisées à travers ses groupes diphényle. Nos données suggèrent que les contacts de liaison hydrogène et le groupe di-THF dans le DRV, ainsi que le caractère hydrophobe du PL-100, contribuent à la liaison à la protéase ainsi qu’à la haute barrière génétique contre la résistance et que la refonte de la structure de PL-100 pour inclure un groupe di-THF pourrait améliorer l’activité antivirale et le profil de résistance.
Resumo:
Étude de cas / Case study
Resumo:
Parmi les méthodes d’estimation de paramètres de loi de probabilité en statistique, le maximum de vraisemblance est une des techniques les plus populaires, comme, sous des conditions l´egères, les estimateurs ainsi produits sont consistants et asymptotiquement efficaces. Les problèmes de maximum de vraisemblance peuvent être traités comme des problèmes de programmation non linéaires, éventuellement non convexe, pour lesquels deux grandes classes de méthodes de résolution sont les techniques de région de confiance et les méthodes de recherche linéaire. En outre, il est possible d’exploiter la structure de ces problèmes pour tenter d’accélerer la convergence de ces méthodes, sous certaines hypothèses. Dans ce travail, nous revisitons certaines approches classiques ou récemment d´eveloppées en optimisation non linéaire, dans le contexte particulier de l’estimation de maximum de vraisemblance. Nous développons également de nouveaux algorithmes pour résoudre ce problème, reconsidérant différentes techniques d’approximation de hessiens, et proposons de nouvelles méthodes de calcul de pas, en particulier dans le cadre des algorithmes de recherche linéaire. Il s’agit notamment d’algorithmes nous permettant de changer d’approximation de hessien et d’adapter la longueur du pas dans une direction de recherche fixée. Finalement, nous évaluons l’efficacité numérique des méthodes proposées dans le cadre de l’estimation de modèles de choix discrets, en particulier les modèles logit mélangés.
Resumo:
La liste des domaines touchés par l’apprentissage machine s’allonge rapidement. Au fur et à mesure que la quantité de données disponibles augmente, le développement d’algorithmes d’apprentissage de plus en plus puissants est crucial. Ce mémoire est constitué de trois parties: d’abord un survol des concepts de bases de l’apprentissage automatique et les détails nécessaires pour l’entraînement de réseaux de neurones, modèles qui se livrent bien à des architectures profondes. Ensuite, le premier article présente une application de l’apprentissage machine aux jeux vidéos, puis une méthode de mesure performance pour ceux-ci en tant que politique de décision. Finalement, le deuxième article présente des résultats théoriques concernant l’entraînement d’architectures profondes nonsupervisées. Les jeux vidéos sont un domaine particulièrement fertile pour l’apprentissage automatique: il estf facile d’accumuler d’importantes quantités de données, et les applications ne manquent pas. La formation d’équipes selon un critère donné est une tˆache commune pour les jeux en lignes. Le premier article compare différents algorithmes d’apprentissage à des réseaux de neurones profonds appliqués à la prédiction de la balance d’un match. Ensuite nous présentons une méthode par simulation pour évaluer les modèles ainsi obtenus utilisés dans le cadre d’une politique de décision en ligne. Dans un deuxième temps nous présentons une nouvelleméthode pour entraîner des modèles génératifs. Des résultats théoriques nous indiquent qu’il est possible d’entraîner par rétropropagation des modèles non-supervisés pouvant générer des échantillons qui suivent la distribution des données. Ceci est un résultat pertinent dans le cadre de la récente littérature scientifique investiguant les propriétés des autoencodeurs comme modèles génératifs. Ces résultats sont supportés avec des expériences qualitatives préliminaires ainsi que quelques résultats quantitatifs.
Resumo:
Les études génétiques, telles que les études de liaison ou d’association, ont permis d’acquérir une plus grande connaissance sur l’étiologie de plusieurs maladies affectant les populations humaines. Même si une dizaine de milliers d’études génétiques ont été réalisées sur des centaines de maladies ou autres traits, une grande partie de leur héritabilité reste inexpliquée. Depuis une dizaine d’années, plusieurs percées dans le domaine de la génomique ont été réalisées. Par exemple, l’utilisation des micropuces d’hybridation génomique comparative à haute densité a permis de démontrer l’existence à grande échelle des variations et des polymorphismes en nombre de copies. Ces derniers sont maintenant détectables à l’aide de micropuce d’ADN ou du séquençage à haut débit. De plus, des études récentes utilisant le séquençage à haut débit ont permis de démontrer que la majorité des variations présentes dans l’exome d’un individu étaient rares ou même propres à cet individu. Ceci a permis la conception d’une nouvelle micropuce d’ADN permettant de déterminer rapidement et à faible coût le génotype de plusieurs milliers de variations rares pour un grand ensemble d’individus à la fois. Dans ce contexte, l’objectif général de cette thèse vise le développement de nouvelles méthodologies et de nouveaux outils bio-informatiques de haute performance permettant la détection, à de hauts critères de qualité, des variations en nombre de copies et des variations nucléotidiques rares dans le cadre d’études génétiques. Ces avancées permettront, à long terme, d’expliquer une plus grande partie de l’héritabilité manquante des traits complexes, poussant ainsi l’avancement des connaissances sur l’étiologie de ces derniers. Un algorithme permettant le partitionnement des polymorphismes en nombre de copies a donc été conçu, rendant possible l’utilisation de ces variations structurales dans le cadre d’étude de liaison génétique sur données familiales. Ensuite, une étude exploratoire a permis de caractériser les différents problèmes associés aux études génétiques utilisant des variations en nombre de copies rares sur des individus non reliés. Cette étude a été réalisée avec la collaboration du Wellcome Trust Centre for Human Genetics de l’University of Oxford. Par la suite, une comparaison de la performance des algorithmes de génotypage lors de leur utilisation avec une nouvelle micropuce d’ADN contenant une majorité de marqueurs rares a été réalisée. Finalement, un outil bio-informatique permettant de filtrer de façon efficace et rapide des données génétiques a été implémenté. Cet outil permet de générer des données de meilleure qualité, avec une meilleure reproductibilité des résultats, tout en diminuant les chances d’obtenir une fausse association.
Resumo:
L'objectif du présent mémoire vise à présenter des modèles de séries chronologiques multivariés impliquant des vecteurs aléatoires dont chaque composante est non-négative. Nous considérons les modèles vMEM (modèles vectoriels et multiplicatifs avec erreurs non-négatives) présentés par Cipollini, Engle et Gallo (2006) et Cipollini et Gallo (2010). Ces modèles représentent une généralisation au cas multivarié des modèles MEM introduits par Engle (2002). Ces modèles trouvent notamment des applications avec les séries chronologiques financières. Les modèles vMEM permettent de modéliser des séries chronologiques impliquant des volumes d'actif, des durées, des variances conditionnelles, pour ne citer que ces applications. Il est également possible de faire une modélisation conjointe et d'étudier les dynamiques présentes entre les séries chronologiques formant le système étudié. Afin de modéliser des séries chronologiques multivariées à composantes non-négatives, plusieurs spécifications du terme d'erreur vectoriel ont été proposées dans la littérature. Une première approche consiste à considérer l'utilisation de vecteurs aléatoires dont la distribution du terme d'erreur est telle que chaque composante est non-négative. Cependant, trouver une distribution multivariée suffisamment souple définie sur le support positif est plutôt difficile, au moins avec les applications citées précédemment. Comme indiqué par Cipollini, Engle et Gallo (2006), un candidat possible est une distribution gamma multivariée, qui impose cependant des restrictions sévères sur les corrélations contemporaines entre les variables. Compte tenu que les possibilités sont limitées, une approche possible est d'utiliser la théorie des copules. Ainsi, selon cette approche, des distributions marginales (ou marges) peuvent être spécifiées, dont les distributions en cause ont des supports non-négatifs, et une fonction de copule permet de tenir compte de la dépendance entre les composantes. Une technique d'estimation possible est la méthode du maximum de vraisemblance. Une approche alternative est la méthode des moments généralisés (GMM). Cette dernière méthode présente l'avantage d'être semi-paramétrique dans le sens que contrairement à l'approche imposant une loi multivariée, il n'est pas nécessaire de spécifier une distribution multivariée pour le terme d'erreur. De manière générale, l'estimation des modèles vMEM est compliquée. Les algorithmes existants doivent tenir compte du grand nombre de paramètres et de la nature élaborée de la fonction de vraisemblance. Dans le cas de l'estimation par la méthode GMM, le système à résoudre nécessite également l'utilisation de solveurs pour systèmes non-linéaires. Dans ce mémoire, beaucoup d'énergies ont été consacrées à l'élaboration de code informatique (dans le langage R) pour estimer les différents paramètres du modèle. Dans le premier chapitre, nous définissons les processus stationnaires, les processus autorégressifs, les processus autorégressifs conditionnellement hétéroscédastiques (ARCH) et les processus ARCH généralisés (GARCH). Nous présentons aussi les modèles de durées ACD et les modèles MEM. Dans le deuxième chapitre, nous présentons la théorie des copules nécessaire pour notre travail, dans le cadre des modèles vectoriels et multiplicatifs avec erreurs non-négatives vMEM. Nous discutons également des méthodes possibles d'estimation. Dans le troisième chapitre, nous discutons les résultats des simulations pour plusieurs méthodes d'estimation. Dans le dernier chapitre, des applications sur des séries financières sont présentées. Le code R est fourni dans une annexe. Une conclusion complète ce mémoire.