947 resultados para genetics, statistical genetics, variable models
Resumo:
This paper develops stochastic search variable selection (SSVS) for zero-inflated count models which are commonly used in health economics. This allows for either model averaging or model selection in situations with many potential regressors. The proposed techniques are applied to a data set from Germany considering the demand for health care. A package for the free statistical software environment R is provided.
Resumo:
Trait decay may occur when selective pressures shift, owing to changes in environment or life style, rendering formerly adaptive traits non-functional or even maladaptive. It remains largely unknown if such decay would stem from multiple mutations with small effects or rather involve few loci with major phenotypic effects. Here, we investigate the decay of female sexual traits, and the genetic causes thereof, in a transition from haplodiploid sexual reproduction to endosymbiont-induced asexual reproduction in the parasitoid wasp Asobara japonica. We take advantage of the fact that asexual females cured of their endosymbionts produce sons instead of daughters, and that these sons can be crossed with sexual females. By combining behavioral experiments with crosses designed to introgress alleles from the asexual into the sexual genome, we found that sexual attractiveness, mating, egg fertilization and plastic adjustment of offspring sex ratio (in response to variation in local mate competition) are decayed in asexual A. japonica females. Furthermore, introgression experiments revealed that the propensity for cured asexual females to produce only sons (because of decayed sexual attractiveness, mating behavior and/or egg fertilization) is likely caused by recessive genetic effects at a single locus. Recessive effects were also found to cause decay of plastic sex-ratio adjustment under variable levels of local mate competition. Our results suggest that few recessive mutations drive decay of female sexual traits, at least in asexual species deriving from haplodiploid sexual ancestors.
Resumo:
The timing and the organization of sleep architecture are mainly controlled by the circadian system, while sleep need and intensity are regulated by a homeostatic process. How independent these two systems are in regulating sleep is not well understood. In contrast to the impressive progress in the molecular genetics of circadian rhythms, little is known about the molecular basis of sleep. Nevertheless, as summarized here, phenotypic dissection of sleep into its most basic aspects can be used to identify both the single major genes and small effect quantitative trait loci involved. Although experimental models such as the mouse are more readily amenable to genetic analysis of sleep, similar approaches can be applied to humans.
Resumo:
Habitat destruction and fragmentation are known to strongly affect dispersal by altering the quality of the environment between populations. As a consequence, lower landscape connectivity is expected to enhance extinction risks through a decrease in gene flow and the resulting negative effects of genetic drift, accumulation of deleterious mutations and inbreeding depression. Such phenomena are particularly harmful for amphibian species, characterized by disjunct breeding habitats. The dispersal behaviour of amphibians being poorly understood, it is crucial to develop new tools, allowing us to determine the influence of landscape connectivity on the persistence of populations. In this study, we developed a new landscape genetics approach that aims at identifying land-uses affecting genetic differentiation, without a priori assumptions about associated ecological costs. We surveyed genetic variation at seven microsatellite loci for 19 Alpine newt (Mesotriton alpestris) populations in western Switzerland. Using strips of varying widths that define a dispersal corridor between pairs of populations, we were able to identify land-uses that act as dispersal barriers (i.e. urban areas) and corridors (i.e. forests). Our results suggest that habitat destruction and landscape fragmentation might in the near future affect common species such as M. alpestris. In addition, by identifying relevant landscape variables influencing population structure without unrealistic assumptions about dispersal, our method offers a simple and flexible tool of investigation as an alternative to least-cost models and other approaches.
Resumo:
Summary (in English) Computer simulations provide a practical way to address scientific questions that would be otherwise intractable. In evolutionary biology, and in population genetics in particular, the investigation of evolutionary processes frequently involves the implementation of complex models, making simulations a particularly valuable tool in the area. In this thesis work, I explored three questions involving the geographical range expansion of populations, taking advantage of spatially explicit simulations coupled with approximate Bayesian computation. First, the neutral evolutionary history of the human spread around the world was investigated, leading to a surprisingly simple model: A straightforward diffusion process of migrations from east Africa throughout a world map with homogeneous landmasses replicated to very large extent the complex patterns observed in real human populations, suggesting a more continuous (as opposed to structured) view of the distribution of modern human genetic diversity, which may play a better role as a base model for further studies. Second, the postglacial evolution of the European barn owl, with the formation of a remarkable coat-color cline, was inspected with two rounds of simulations: (i) determine the demographic background history and (ii) test the probability of a phenotypic cline, like the one observed in the natural populations, to appear without natural selection. We verified that the modern barn owl population originated from a single Iberian refugium and that they formed their color cline, not due to neutral evolution, but with the necessary participation of selection. The third and last part of this thesis refers to a simulation-only study inspired by the barn owl case above. In this chapter, we showed that selection is, indeed, effective during range expansions and that it leaves a distinguished signature, which can then be used to detect and measure natural selection in range-expanding populations. Résumé (en français) Les simulations fournissent un moyen pratique pour répondre à des questions scientifiques qui seraient inabordable autrement. En génétique des populations, l'étude des processus évolutifs implique souvent la mise en oeuvre de modèles complexes, et les simulations sont un outil particulièrement précieux dans ce domaine. Dans cette thèse, j'ai exploré trois questions en utilisant des simulations spatialement explicites dans un cadre de calculs Bayésiens approximés (approximate Bayesian computation : ABC). Tout d'abord, l'histoire de la colonisation humaine mondiale et de l'évolution de parties neutres du génome a été étudiée grâce à un modèle étonnement simple. Un processus de diffusion des migrants de l'Afrique orientale à travers un monde avec des masses terrestres homogènes a reproduit, dans une très large mesure, les signatures génétiques complexes observées dans les populations humaines réelles. Un tel modèle continu (opposé à un modèle structuré en populations) pourrait être très utile comme modèle de base dans l'étude de génétique humaine à l'avenir. Deuxièmement, l'évolution postglaciaire d'un gradient de couleur chez l'Effraie des clocher (Tyto alba) Européenne, a été examiné avec deux séries de simulations pour : (i) déterminer l'histoire démographique de base et (ii) tester la probabilité qu'un gradient phénotypique, tel qu'observé dans les populations naturelles puisse apparaître sans sélection naturelle. Nous avons montré que la population actuelle des chouettes est sortie d'un unique refuge ibérique et que le gradient de couleur ne peux pas s'être formé de manière neutre (sans l'action de la sélection naturelle). La troisième partie de cette thèse se réfère à une étude par simulations inspirée par l'étude de l'Effraie. Dans ce dernier chapitre, nous avons montré que la sélection est, en effet, aussi efficace dans les cas d'expansion d'aire de distribution et qu'elle laisse une signature unique, qui peut être utilisée pour la détecter et estimer sa force.
Resumo:
Sleep disorders are very prevalent and represent an emerging worldwide epidemic. However, research into the molecular genetics of sleep disorders remains surprisingly one of the least active fields. Nevertheless, rapid progress is being made in several prototypical disorders, leading recently to the identification of the molecular pathways underlying narcolepsy and familial advanced sleep-phase syndrome. Since the first reports of spontaneous and induced loss-of-function mutations leading to hypocretin deficiency in human and animal models of narcolepsy, the role of this novel neurotransmission pathway in sleep and several other behaviors has gained extensive interest. Also, very recent studies using an animal model of familial advanced sleep-phase syndrome shed new light on the regulation of circadian rhythms.
Resumo:
Molecular and genetic approaches in several species have provided new insights into the mechanisms of rest-activity and sleep-wake regulation. Many of these discoveries are believed to support hypotheses about sleep functions, which nevertheless remain elusive. In this review we discuss the specific contribution of both mammalian and invertebrate models to our understanding of the molecular basis of sleep.
Resumo:
A population-genetic model indicates that if there is a gene responsible for homosexual behaviour it can readily spread in populations. The model also predicts widespread bisexuality in humans.
Resumo:
Type-1 (T1R) and Type-2 (T2R) leprosy reactions (LR), which affect up to 50% of leprosy patients, are aggressive inflammatory episodes of sudden onset and highly variable incidence across populations. LR are often diagnosed concurrently with leprosy, but more frequently occur several months after treatment onset. It is not uncommon for leprosy patients to develop recurring reactional episodes; however, they rarely undergo both types of LR. Today, LR are the main cause of permanent disabilities associated with leprosy and represent a major challenge in the clinical management of leprosy patients. Although progress has been made in understanding the immunopathology of LR, the factors that cause a leprosy patient to suffer from LR are largely unknown. Given the impact that ethnic background has on the risk of developing LR, host genetic factors have long been suspected of contributing to LR. Indeed, polymorphisms in seven genes [Toll-like receptors (TLR)1, TLR2, nucleotide-binding oligomerisation domain containing 2, vitamin D receptor, natural resistance-associated macrophage protein 1, C4B and interleukin-6] have been found to be associated with one or more LR outcomes. The identification of host genetic markers with predictive value for LR would have a major impact on nerve damage control in leprosy. In this review, we present the recent advances achieved through genetic studies of LR.
Resumo:
Idiopathic hypogonadotropic hypogonadism (IHH) is an important human disease model. Investigations of the genetics of IHH have facilitated insights into critical pathways regulating sexual maturation and fertility. IHH has been traditionally considered a monogenic disorder. This model holds that a single gene defect is responsible for the disease in each patient. In the case of IHH, 30% of cases are explained by mutations in one of eleven genes. In recent years, several lines of evidence have challenged the monogenic paradigm in IHH. First, disease-associated mutations display striking incomplete penetrance and variable expressivity within and across IHH families. Second, each locus is responsible for only a small percentage of cases. Third, more than one disease-associated mutation seems to be segregating in some families with IHH, and their combined or separate presence in individuals accounts for the variability in disease severity. Finally, IHH is not strictly a congenital and life-long disorder; occasionally it manifests itself during adulthood (adult-onset IHH); in other cases, the disease is not permanent, as evidenced by normal activity of the hypothalamic-pituitary-gonadal axis after discontinuation of treatment in adulthood (IHH reversal). Together, these observations suggest that IHH is not strictly a monogenic mendelian disease, as previously thought. Rather, it is emerging as a digenic, and potentially oligogenic disease, in which hormonal and/or environmental factors may critically influence genetic predisposition and clinical course. Future investigations of IHH should characterize the extent of the involvement of multiple genes in disease pathogenesis, and elucidate the contributions of epigenetic factors.
Resumo:
SUMMARY Heavy metal presence in the environment is a serious concern since some of them can be toxic to plants, animals and humans once accumulated along the food chain. Cadmium (Cd) is one of the most toxic heavy metal. It is naturally present in soils at various levels and its concentration can be increased by human activities. Several plants however have naturally developed strategies allowing them to grow on heavy metal enriched soils. One of them consists in the accumulation and sequestration of heavy metals in the above-ground biomass. Some plants present in addition an extreme strategy by which they accumulate a limited number of heavy metals in their shoots in amounts 100 times superior to those expected for a non-accumulating plant in the same conditions. Understanding the genetic basis of the hyperaccumulation trait - particularly for Cd - remains an important challenge which may lead to biotechnological applications in the soil phytoremediation. In this thesis, Thlaspi caerulescens J. & C. Presl (Brassicaceae) was used as a model plant to study the Cd hyperaccumulation trait, owing to its physiological and genetic characteristics. Twenty-four wild populations were sampled in different regions of Switzerland. They were characterized for environmental and soil parameters as well as intrinsic characteristics of plants (i.e. metal concentrations in shoots). They were as well genetically characterized by AFLPs, plastid DNA polymorphism and genes markers (CAPS and microsatellites) mainly developed in this thesis. Some of the investigated genes were putatively linked to the Cd hyperaccumulation trait. Since the study of the Cd hyperaccumulation in the field is important as it allows the identification of patterns of selection, the present work offered a methodology to define the Cd hyperaccumulation capacity of populations from different habitats permitting thus their comparison in the field. We showed that Cd, Zn, Fe and Cu accumulations were linked and that populations with higher Cd hyperaccumulation capacity had higher shoot and reproductive fitness. Using our genetic data, statistical methods (Beaumont & Nichols's procedure, partial Mantel tests) were applied to identify genomic signatures of natural selection related to the Cd hyperaccumulation capacity. A significant genetic difference between populations related to their Cd hyperaccumulation capacity was revealed based on somè specific markers (AFLP and candidate genes). Polymorphism at the gene encoding IRTl (Iron-transporter also participating to the transport of Zn) was suggested as explaining part of the variation in Cd hyperaccumulation capacity of populations supporting previous physiological investigations. RÉSUMÉ La présence de métaux lourds dans l'environnement est un phénomène préoccupant. En effet, certains métaux lourds - comme le cadmium (Cd) -sont toxiques pour les plantes, les animaux et enfin, accumulés le long de la chaîne alimentaire, pour les hommes. Le Cd est naturellement présent dans le sol et sa concentration peut être accrue par différentes activités humaines. Certaines plantes ont cependant développé des stratégies leur permettant de pousser sur des sols contaminés en métaux lourds. Parmi elles, certaines accumulent et séquestrent les métaux lourds dans leurs parties aériennes. D`autres présentent une stratégie encore plus extrême. Elles accumulent un nombre limité de métaux lourds en quantités 100 fois supérieures à celles attendues pour des espèces non-accumulatrices sous de mêmes conditions. La compréhension des bases génétiques de l'hyperaccumulation -particulièrement celle du Cd - représente un défi important avec des applications concrètes en biotechnologies, tout particulièrement dans le but appliqué de la phytoremediation des sols contaminés. Dans cette thèse, Thlaspi caerulescens J. & C. Presl (Brassicaceae) a été utilisé comme modèle pour l'étude de l'hyperaccumulation du Cd de par ses caractéristiques physiologiques et génétiques. Vingt-quatre populations naturelles ont été échantillonnées en Suisse et pour chacune d'elles les paramètres environnementaux, pédologique et les caractéristiques intrinsèques aux plantes (concentrations en métaux lourds) ont été déterminés. Les populations ont été caractérisées génétiquement par des AFLP, des marqueurs chloroplastiques et des marqueurs de gènes spécifiques, particulièrement ceux potentiellement liés à l'hyperaccumulation du Cd (CAPS et microsatellites). La plupart ont été développés au cours de cette thèse. L'étude de l'hyperaccumulation du Cd en conditions naturelles est importante car elle permet d'identifier la marque, éventuelle de sélection naturelle. Ce travail offre ainsi une méthodologie pour définir et comparer la capacité des populations à hyperaccumuler le Cd dans différents habitats. Nous avons montré que les accumulations du Cd, Zn, Fe et Cu sont liées et que les populations ayant une grande capacité d'hyperaccumuler le Cd ont également une meilleure fitness végétative et reproductive. Des méthodes statistiques (l'approche de Beaumont & Nichols, tests de Martel partiels) ont été utilisées sur les données génétiques pour identifier la signature génomique de la sélection naturelle liée à la capacité d'hyperaccumuler le Cd. Une différenciation génétique des populations liée à leur capacité d'hyperaccumuler le Cd a été mise en évidence sur certains marqueurs spécifiques. En accord avec les études physiologiques connues, le polymorphisme au gène codant IRT1 (un transporteur de Fe impliqué dans le transport du Zn) pourrait expliquer une partie de la variance de la capacité des populations à hyperaccumuler le Cd.
Resumo:
Human genetics has progressed at an unprecedented pace during the past 10 years. DNA microarrays currently allow screening of the entire human genome with high level of coverage and we are now entering the era of high-throughput sequencing. These remarkable technical advances are influencing the way medical research is conducted and have boosted our understanding of the structure of the human genome as well as of disease biology. In this context, it is crucial for clinicians to understand the main concepts and limitations of modern genetics. This review will describe key concepts in genetics, including the different types of genetic markers in the human genome, review current methods to detect DNA variation, describe major online public databases in genetics, explain key concepts in statistical genetics and finally present commonly used study designs in clinical and epidemiological research. This review will therefore concentrate on human genetic variation analysis.
Resumo:
Summary [résumé français voir ci-dessous] From the beginning of the 20th century the world population has been confronted with the human immune deficiency virus 1 (HIV-1). This virus has the particularity to mutate fast, and could thus evade and adapt to the human host. Our closest evolutionary related organisms, the non-human primates, are less susceptible to HIV-1. In a broader sense, primates are differentially susceptible to various retrovirus. Species specificity may be due to genetic differences among primates. In the present study we applied evolutionary and comparative genetic techniques to characterize the evolutionary pattern of host cellular determinants of HIV-1 pathogenesis. The study of the evolution of genes coding for proteins participating to the restriction or pathogenesis of HIV-1 may help understanding the genetic basis of modern human susceptibility to infection. To perform comparative genetics analysis, we constituted a collection of primate DNA and RNA to allow generation of de novo sequence of gene orthologs. More recently, release to the public domain of two new primate complete genomes (bornean orang-utan and common marmoset) in addition of the three previously available genomes (human, chimpanzee and Rhesus monkey) help scaling up the evolutionary and comparative genome analysis. Sequence analysis used phylogenetic and statistical methods for detecting molecular adaptation. We identified different selective pressures acting on host proteins involved in HIV-1 pathogenesis. Proteins with HIV-1 restriction properties in non-human primates were under strong positive selection, in particular in regions of interaction with viral proteins. These regions carried key residues for the antiviral activity. Proteins of the innate immunity presented an evolutionary pattern of conservation (purifying selection) but with signals of relaxed constrain if we compared them to the average profile of purifying selection of the primate genomes. Large scale analysis resulted in patterns of evolutionary pressures according to molecular function, biological process and cellular distribution. The data generated by various analyses served to guide the ancestral reconstruction of TRIM5a a potent antiviral host factor. The resurrected TRIM5a from the common ancestor of Old world monkeys was effective against HIV-1 and the recent resurrected hominoid variants were more effective against other retrovirus. Thus, as the result of trade-offs in the ability to restrict different retrovirus, human might have been exposed to HIV-1 at a time when TRIM5a lacked the appropriate specific restriction activity. The application of evolutionary and comparative genetic tools should be considered for the systematical assessment of host proteins relevant in viral pathogenesis, and to guide biological and functional studies. Résumé La population mondiale est confrontée depuis le début du vingtième siècle au virus de l'immunodéficience humaine 1 (VIH-1). Ce virus a un taux de mutation particulièrement élevé, il peut donc s'évader et s'adapter très efficacement à son hôte. Les organismes évolutivement le plus proches de l'homme les primates nonhumains sont moins susceptibles au VIH-1. De façon générale, les primates répondent différemment aux rétrovirus. Cette spécificité entre espèces doit résider dans les différences génétiques entre primates. Dans cette étude nous avons appliqué des techniques d'évolution et de génétique comparative pour caractériser le modèle évolutif des déterminants cellulaires impliqués dans la pathogenèse du VIH- 1. L'étude de l'évolution des gènes, codant pour des protéines impliquées dans la restriction ou la pathogenèse du VIH-1, aidera à la compréhension des bases génétiques ayant récemment rendu l'homme susceptible. Pour les analyses de génétique comparative, nous avons constitué une collection d'ADN et d'ARN de primates dans le but d'obtenir des nouvelles séquences de gènes orthologues. Récemment deux nouveaux génomes complets ont été publiés (l'orang-outan du Bornéo et Marmoset commun) en plus des trois génomes déjà disponibles (humain, chimpanzé, macaque rhésus). Ceci a permis d'améliorer considérablement l'étendue de l'analyse. Pour détecter l'adaptation moléculaire nous avons analysé les séquences à l'aide de méthodes phylogénétiques et statistiques. Nous avons identifié différentes pressions de sélection agissant sur les protéines impliquées dans la pathogenèse du VIH-1. Des protéines avec des propriétés de restriction du VIH-1 dans les primates non-humains présentent un taux particulièrement haut de remplacement d'acides aminés (sélection positive). En particulier dans les régions d'interaction avec les protéines virales. Ces régions incluent des acides aminés clé pour l'activité de restriction. Les protéines appartenant à l'immunité inné présentent un modèle d'évolution de conservation (sélection purifiante) mais avec des traces de "relaxation" comparé au profil général de sélection purifiante du génome des primates. Une analyse à grande échelle a permis de classifier les modèles de pression évolutive selon leur fonction moléculaire, processus biologique et distribution cellulaire. Les données générées par les différentes analyses ont permis la reconstruction ancestrale de TRIM5a, un puissant facteur antiretroviral. Le TRIM5a ressuscité, correspondant à l'ancêtre commun entre les grands singes et les groupe des catarrhiniens, est efficace contre le VIH-1 moderne. Les TRIM5a ressuscités plus récents, correspondant aux ancêtres des grands singes, sont plus efficaces contre d'autres rétrovirus. Ainsi, trouver un compromis dans la capacité de restreindre différents rétrovirus, l'homme aurait été exposé au VIH-1 à une période où TRIM5a manquait d'activité de restriction spécifique contre celui-ci. L'application de techniques d'évolution et de génétique comparative devraient être considérées pour l'évaluation systématique de protéines impliquées dans la pathogenèse virale, ainsi que pour guider des études biologiques et fonctionnelles
Resumo:
Résumé Les champignons endomycorhiziens arbusculaires (CEA) forment des symbioses avec la plupart des plantes terrestres. Les CEA influencent la croissance des plantes et la biodiversité. Ils sont supposés avoir évolué de manière asexuée pendant au moins 400 millions d'années et aucune diversification morphologique majeure n'a été constatée. Pour ces raisons, les CEA sont considérés comme d'anciens asexués. Très peu d'espèces sont connues actuellement. Les individus de ces champignons contiennent des noyaux génétiquement différents dans un cytoplasme continu. La signification évolutive, la variabilité et la maintenance des génomes multiples au sein des individus sont inconnues. Ce travail a démontré qu'une population du CEA Glomus intraradices est génétiquement très variable. Nous avons conclu que les plantes hôtes plutôt que la différenciation géographique devraient être responsables de cette grande diversité. Puis nous avons cherché l'existence de recombinaison entre génotypes dans une population. Nous avons détecté un groupe recombinant au sein de la population, ce qui met en doute l'état d'anciens asexués des CEA. Nous avons également détecté l'occurrence de fusions d'hyphes et l'échange de noyaux entre isolats génétiquement différents. La descendance hybride issue de cet échange était viable et distincte phénotypiquement des isolats parentaux. En résumé, ce travail identifie des événements cruciaux dans le cycle de vie des CEA qui ont le potentiel d'influencer l'évolution de génomes multiples. L'étude des conséquences de ces événements sur les interactions avec les plantes hôtes pourrait éclaircir significativement la compréhension de la symbiose entre plantes et CEA. Abstract Arbuscular mycorrhizal fungi (AMF) are important symbionts of most land plants. AMF influence plant growth and biodiversity. Very few extant species are described. AMF are thought to have evolved asexually for at least 400 million years and no major morphological diversification has occurred. Due to these reasons, they were termed `ancient asexuals'. Fungal individuals harbour genetically different nuclei in a continuous cytoplasm. The variability, maintenance and evolutionary significance of multiple genomes within individuals are unknown. This work showed that a population of the AMF Glomus intraradices harbours very high genetic diversity. We concluded that host plants rather than geographic differentiation were responsible for this diversity. Furthermore, we investigated whether recombination occurred among genotypes of a G. intraradices population. The identification of a core group of recombining genotypes in the population refutes the assumption of ancient asexuality in AMF. We found that genetically different isolates can form hyphal fusions and exchange nuclei. The hybrid progeny produced by the exchange was viable and phenotypically distinct from the parental isolates. Taken together, this work provided evidence for key events in the AMF life cycle, that influence the evolution of multiple genomes. Studying the consequences of these events on the interaction with host plants may significantly further the understanding of the AMF-plant symbiosis.
Resumo:
Summary : During the evolutionary diversification of organisms, similar ecological constraints led to the recurrent appearances of the same traits (phenotypes) in distant lineages, a phenomenon called convergence. In most cases, the genetic origins of the convergent traits remain unknown, but recent studies traced the convergent phenotypes to recurrent alterations of the same gene or, in a few cases, to identical genetic changes. However, these cases remain anecdotal and there is a need for a study system that evolved several times independently and whose genetic determinism is well resolved and straightforward, such as C4 photosynthesis. This adaptation to warm environments, possibly driven by past atmospheric CO2 decreases, consists in a CO2-concentrating pump, created by numerous morphological and biochemical novelties. All genes encoding C4 enzymes already existed in C3 ancestors, and are supposed to have been recruited through gene duplication followed by neo-functionalization, to acquire the cell specific expression pattern and altered kinetic properties that characterize Ca-specific enzymes. These predictions have so far been tested only in species-poor and ecologically marginal C4 dicots. The monocots, and especially the grass family (Poaceae), the most important C4 family in terms of species number, ecological dominance and economical importance, have been largely under-considered as suitable study systems. This thesis aimed at understanding the evolution of the C4 trait in grasses at a molecular level and to use the genetics of C4 photosynthesis to infer the evolutionary history of the C4 phenotype and its driving selective pressures. A molecular phylogeny of grasses and affiliated monocots identified 17 to 18 independent acquisitions of the C4 pathway in the grass family. A relaxed molecular clock was used to date these events and the first C4 evolution was estimated in the Chloridoideae subfamily, between 32-25 million years ago, at a period when atmospheric CO2 abruptly declined. Likelihood models showed that after the COZ decline the probability of evolving the C4 pathway strongly increased, confirming low CO2 as a likely driver of C4 photosynthesis evolution. In order to depict the genetic changes linked to the numerous C4 origins, genes encoding phopshoenolpyruvate carboxylase (PEPC), the key-enzyme responsible for the initial fixation of atmospheric CO2 in the C4 pathway, were isolated from a large sample of C3 and C4 grasses. Phylogenetic analyses were used to reconstruct the evolutionary history of the PEPC multigene family and showed that the evolution of C4-specific PEPC had been driven by positive selection on 21 codons simultaneously in up to eight C4 lineages. These selective pressures led to numerous convergent genetic changes in many different C4 clades, highlighting the repeatability of some evolutionary processes, even at the molecular level. PEPC C4-adaptive changes were traced and used to show multiple appearances of the C, pathway in clades where species tree inferences were unable to differentiate multiple C4 appearances and a single appearance followed by C4 to C3 reversion. Further investigations of genes involved in some of the C4 subtypes only (genes encoding decarboxylating enzymes NADP-malic enzyme and phosphoenolpyruvate carboxykinase) showed that these C4-enzymes also evolved through strong positive selection and underwent parallel genetic changes during the different Ca origins. The adaptive changes on these subtype-specific C4 genes were used to retrace the history of the C4-subtypes phenotypes, which revealed that the evolution of C4-PEPC and C4-decarboxylating enzymes was in several cases disconnected, emphasizing the multiplicity of the C4 trait and the gradual acquisition of the features that create the CO2-pump. Finally, phylogenetic analyses of a gene encoding the Rubisco (the enzyme responsible for the fixation of CO2 into organic compounds in all photosynthetic organisms) showed that C4 evolution switched the selective pressures on this gene. Five codons were recurrently mutated to adapt the enzyme kinetics to the high CO2 concentrations of C4 photosynthetic cells. This knowledge could be used to introgress C4-like Rubisco in C3 crops, which could lead to an increased yield under predicted future high CO2 atmosphere. Globally, the phylogenetic framework adopted during this thesis demonstrated the widespread occurrence of genetic convergence on C4-related enzymes. The genetic traces of C4 photosynthesis evolution allowed reconstructing events that happened during the last 30 million years and proved the usefulness of studying genes directly responsible for phenotype variations when inferring evolutionary history of a given trait. Résumé Durant la diversification évolutive des organismes, des pressions écologiques similaires ont amené à l'apparition récurrente de certains traits (phénotypes) dans des lignées distantes, un phénomène appelé évolution convergente. Dans la plupart des cas, l'origine génétique des traits convergents reste inconnue mais des études récentes ont montré qu'ils étaient dus dans certains cas à des changements répétés du même gène ou, dans de rares cas, à des changements génétiques identiques. Malgré tout, ces cas restent anecdotiques et il y a un réel besoin d'un système d'étude qui ait évolué indépendamment de nombreuses fois et dont le déterminisme génétique soit clairement identifié. La photosynthèse dite en Ça répond à ces critères. Cette adaptation aux environnements chauds, dont l'évolution a pu être encouragé par des baisses passées de la concentration atmosphérique en CO2, est constituée de nombreuses nouveautés morphologiques et biochimiques qui créent une pompe à CO2. La totalité des gènes codant les enzymes Ç4 étaient déjà présents dans les ancêtres C3. Leur recrutement pour la photosynthèse Ç4 est supposé s'être fait par le biais de duplications géniques suivies par une néo-fonctionnalisation pour leur conférer l'expression cellule-spécifique et les propriétés cinétiques qui caractérisent les enzymes C4. Ces prédictions n'ont jusqu'à présent été testées que dans des familles C4 contenant peu d'espèces et ayant un rôle écologique marginal. Les graminées (Poaceae), qui sont la famille C4 la plus importante, tant en termes de nombre d'espèces que de dominance écologique et d'importance économique, ont toujours été considérés comme un système d'étude peu adapté et ont fait le sujet de peu d'investigations évolutives. Le but de cette thèse était de comprendre l'évolution de la photosynthèse en C4 chez les graminées au niveau génétique et d'utiliser les gènes pour inférer l'évolution du phénotype C4 ainsi que les pressions de sélection responsables de son évolution. Une phylogénie moléculaire de la famille des graminées et des monocotylédones apparentés a identifié 17 à 18 acquisitions indépendantes de la photosynthèse chez les graminées. Grâce à une méthode d'horloge moléculaire relâchée, ces évènements ont été datés et la première apparition C4 a été estimée dans la sous-famille des Chloridoideae, il y a 32 à 25 millions d'années, à une période où les concentrations atmosphériques de CO2 ont décliné abruptement. Des modèles de maximum de vraisemblance ont montré qu'à la suite du déclin de CO2, la probabilité d'évoluer la photosynthèse C4 a fortement augmenté, confirmant ainsi qu'une faible concentration de CO2 est une cause potentielle de l'évolution de la photosynthèse C4. Afin d'identifier les mécanismes génétiques responsables des évolutions répétées de la photosynthèse C4, un segment des gènes codant pour la phosphoénolpyruvate carboxylase (PEPC), l'enzyme responsable de la fixation initiale du CO2 atmosphérique chez les plantes C4, ont été séquencés dans une centaine de graminées C3 et C4. Des analyses phylogénétiques ont permis de reconstituer l'histoire évolutive de la famille multigénique des PEPC et ont montré que l'évolution de PEPC spécifiques à la photosynthèse Ça a été causée par de la sélection positive agissant sur 21 codons, et ce simultanément dans huit lignées C4 différentes. Cette sélection positive a conduit à un grand nombre de changements génétiques convergents dans de nombreux clades différents, ce qui illustre la répétabilité de certains phénomènes évolutifs, et ce même au niveau génétique. Les changements sur la PEPC liés au C4 ont été utilisés pour confirmer des évolutions indépendantes du phénotype C4 dans des clades où l'arbre des espèces était incapable de différencier des apparitions indépendantes d'une seule apparition suivie par une réversion de C4 en C3. En considérant des gènes codant des protéines impliquées uniquement dans certains sous-types C4 (deux décarboxylases, l'enzyme malique à NADP et la phosphoénolpyruvate carboxykinase), des études ultérieures ont montré que ces enzymes C4 avaient elles-aussi évolué sous forte sélection positive et subi des changements génétiques parallèles lors des différentes origines de la photosynthèse C4. Les changements adaptatifs sur ces gènes liés seulement à certains sous-types C4 ont été utilisés pour retracer l'histoire des phénotypes de sous-types C4, ce qui a révélé que les caractères formant le trait C4 ont, dans certains cas, évolué de manière déconnectée. Ceci souligne la multiplicité du trait C4 et l'acquisition graduelle de composants participant à la pompe à CO2 qu'est la photosynthèse C4. Finalement, des analyses phylogénétiques des gènes codant pour la Rubisco (l'enzyme responsable de la fixation du CO2 en carbones organiques dans tous les organismes photosynthétiques) ont montré que l'évolution de la photosynthèse Ça a changé les pressions de sélection sur ce gène. Cinq codons ont été mutés de façon répétée afin d'adapter les propriétés cinétiques de la Rubisco aux fortes concentrations de CO2 présentes dans les cellules photosynthétiques des plantes C4. Globalement, l'approche phylogénétique adoptée durant cette thèse de doctorat a permis de démontré des phénomène fréquents de convergence génétique sur les enzymes liées à la photosynthèse C4. Les traces génétiques de l'évolution de la photosynthèse C4 ont permis de reconstituer des évènements qui se sont produits durant les derniers 30 millions d'années et ont prouvé l'utilité d'étudier des gènes directement responsables des variations phénotypiques pour inférer l'histoire évolutive d'un trait donné.