22 resultados para Réarrangements génomiques

em Université de Lausanne, Switzerland


Relevância:

60.00% 60.00%

Publicador:

Resumo:

The functional consequences of structural variation in the human genome range from adaptation, to phenotypic variation, to predisposition to diseases. Copy number variation (CNV) was shown to influence the phenotype by modifying, in a somewhat dose-dependent manner, the expression of genes that map within them, as well as that of genes located on their flanks. To assess the possible mechanism(s) behind this neighboring effect, we compared histone modification status of cell lines from patients affected by Williams-Beuren, Williams-Beuren region duplication, Smith-Magenis or DiGeorge Syndrome and control individuals using a high-throughput version of chromatin immuno-precipitation method (ChIP), called ChlP-seq. We monitored monomethylation of lysine K20 on histone H4 and trimethylation of lysine K27 on histone H3, as proxies for open and condensed chromatin, respectively. Consistent with the changes in expression levels observed for multiple genes mapping on the entire length of chromosomes affected by structural variants, we also detected regions with modified histone status between samples, up- and downstream from the critical regions, up to the end of the rearranged chromosome. We also gauged the intrachromosomal interactions of these cell lines utilizing chromosome conformation capture (4C-seq) technique. We observed that a set of genes flanking the Williams-Beuren Syndrome critical region (WBSCR) were often looping together, possibly forming an interacting cluster with each other and the WBSCR. Deletion of the WBSCR disrupts the expression of this group of flanking genes, as well as long-range interactions between them and the rearranged interval. We conclude, that large genomic rearrangements can lead to changes in the state of the chromatin spreading far away from the critical region, thus possibly affecting expression globally and as a result modifying the phenotype of the patients. - Les conséquences fonctionnelles des variations structurelles dans le génome humain sont vastes, allant de l'adaptation, en passant par les variations phénotypiques, aux prédispositions à certaines maladies. Il a été démontré que les variations du nombre de copies (CNV) influencent le phénotype en modifiant, d'une manière plus ou moins dose-dépendante, l'expression des gènes se situant à l'intérieur de ces régions, mais également celle des gènes se trouvant dans les régions flanquantes. Afin d'étudier les mécanismes possibles sous-jacents à cet effet de voisinage, nous avons comparé les états de modification des histones dans des lignées cellulaires dérivées de patients atteints du syndrome de Williams-Beuren, de la duplication de la région Williams-Beuren, du syndrome de Smith-Magenis ou du syndrome de Di- George et d'individus contrôles en utilisant une version haut-débit de la méthode d'immunoprécipitation de la chromatine (ChIP), appelée ChIP-seq. Nous avons suivi la mono-méthylation de la lysine K20 sur l'histone H4 et la tri-méthylation de la lysine K27 sur l'histone H3, marqueurs respectifs de la chromatine ouverte et fermée. En accord avec les changements de niveaux d'expression observés pour de multiples gènes tout le long des chromosomes affectés par les CNVs, nous avons aussi détecté des régions présentant des modifications d'histones entre les échantillons, situées de part et d'autre des régions critiques, jusqu'aux extrémités du chromosome réarrangé. Nous avons aussi évalué les interactions intra-chromosomiques ayant lieu dans ces cellules par l'utilisation de la technique de capture de conformation des chromosomes (4C-seq). Nous avons observé qu'un groupe de gènes flanquants la région critique du syndrome de Williams-Beuren (WBSCR) forment souvent une boucle, constituant un groupe d'interactions privilégiées entre ces gènes et la WBSCR. La délétion de la WBSCR perturbe l'expression de ce groupe de gènes flanquants, mais également les interactions à grande échelle entre eux et la région réarrangée. Nous en concluons que les larges réarrangements génomiques peuvent aboutir à des changements de l'état de la chromatine pouvant s'étendre bien plus loin que la région critique, affectant donc potentiellement l'expression de manière globale et ainsi modifiant le phénotype des patients.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

AbstractAlthough the genomes from any two human individuals are more than 99.99% identical at the sequence level, some structural variation can be observed. Differences between genomes include single nucleotide polymorphism (SNP), inversion and copy number changes (gain or loss of DNA). The latter can range from submicroscopic events (CNVs, at least 1kb in size) to complete chromosomal aneuploidies. Small copy number variations have often no (lethal) consequences to the cell, but a few were associated to disease susceptibility and phenotypic variations. Larger re-arrangements (i.e. complete chromosome gain) are frequently associated with more severe consequences on health such as genomic disorders and cancer. High-throughput technologies like DNA microarrays enable the detection of CNVs in a genome-wide fashion. Since the initial catalogue of CNVs in the human genome in 2006, there has been tremendous interest in CNVs both in the context of population and medical genetics. Understanding CNV patterns within and between human populations is essential to elucidate their possible contribution to disease. But genome analysis is a challenging task; the technology evolves rapidly creating needs for novel, efficient and robust analytical tools which need to be compared with existing ones. Also, while the link between CNV and disease has been established, the relative CNV contribution is not fully understood and the predisposition to disease from CNVs of the general population has not been yet investigated.During my PhD thesis, I worked on several aspects related to CNVs. As l will report in chapter 3, ! was interested in computational methods to detect CNVs from the general population. I had access to the CoLaus dataset, a population-based study with more than 6,000 participants from the Lausanne area. All these individuals were analysed on SNP arrays and extensive clinical information were available. My work explored existing CNV detection methods and I developed a variety of metrics to compare their performance. Since these methods were not producing entirely satisfactory results, I implemented my own method which outperformed two existing methods. I also devised strategies to combine CNVs from different individuals into CNV regions.I was also interested in the clinical impact of CNVs in common disease (chapter 4). Through an international collaboration led by the Centre Hospitalier Universitaire Vaudois (CHUV) and the Imperial College London I was involved as a main data analyst in the investigation of a rare deletion at chromosome 16p11 detected in obese patients. Specifically, we compared 8,456 obese patients and 11,856 individuals from the general population and we found that the deletion was accounting for 0.7% of the morbid obesity cases and was absent in healthy non- obese controls. This highlights the importance of rare variants with strong impact and provides new insights in the design of clinical studies to identify the missing heritability in common disease.Furthermore, I was interested in the detection of somatic copy number alterations (SCNA) and their consequences in cancer (chapter 5). This project was a collaboration initiated by the Ludwig Institute for Cancer Research and involved other groups from the Swiss Institute of Bioinformatics, the CHUV and Universities of Lausanne and Geneva. The focus of my work was to identify genes with altered expression levels within somatic copy number alterations (SCNA) in seven metastatic melanoma ceil lines, using CGH and SNP arrays, RNA-seq, and karyotyping. Very few SCNA genes were shared by even two melanoma samples making it difficult to draw any conclusions at the individual gene level. To overcome this limitation, I used a network-guided analysis to determine whether any pathways, defined by amplified or deleted genes, were common among the samples. Six of the melanoma samples were potentially altered in four pathways and five samples harboured copy-number and expression changes in components of six pathways. In total, this approach identified 28 pathways. Validation with two external, large melanoma datasets confirmed all but three of the detected pathways and demonstrated the utility of network-guided approaches for both large and small datasets analysis.RésuméBien que le génome de deux individus soit similaire à plus de 99.99%, des différences de structure peuvent être observées. Ces différences incluent les polymorphismes simples de nucléotides, les inversions et les changements en nombre de copies (gain ou perte d'ADN). Ces derniers varient de petits événements dits sous-microscopiques (moins de 1kb en taille), appelés CNVs (copy number variants) jusqu'à des événements plus large pouvant affecter des chromosomes entiers. Les petites variations sont généralement sans conséquence pour la cellule, toutefois certaines ont été impliquées dans la prédisposition à certaines maladies, et à des variations phénotypiques dans la population générale. Les réarrangements plus grands (par exemple, une copie additionnelle d'un chromosome appelée communément trisomie) ont des répercutions plus grave pour la santé, comme par exemple dans certains syndromes génomiques et dans le cancer. Les technologies à haut-débit telle les puces à ADN permettent la détection de CNVs à l'échelle du génome humain. La cartographie en 2006 des CNV du génome humain, a suscité un fort intérêt en génétique des populations et en génétique médicale. La détection de différences au sein et entre plusieurs populations est un élément clef pour élucider la contribution possible des CNVs dans les maladies. Toutefois l'analyse du génome reste une tâche difficile, la technologie évolue très rapidement créant de nouveaux besoins pour le développement d'outils, l'amélioration des précédents, et la comparaison des différentes méthodes. De plus, si le lien entre CNV et maladie a été établit, leur contribution précise n'est pas encore comprise. De même que les études sur la prédisposition aux maladies par des CNVs détectés dans la population générale n'ont pas encore été réalisées.Pendant mon doctorat, je me suis concentré sur trois axes principaux ayant attrait aux CNV. Dans le chapitre 3, je détaille mes travaux sur les méthodes d'analyses des puces à ADN. J'ai eu accès aux données du projet CoLaus, une étude de la population de Lausanne. Dans cette étude, le génome de plus de 6000 individus a été analysé avec des puces SNP et de nombreuses informations cliniques ont été récoltées. Pendant mes travaux, j'ai utilisé et comparé plusieurs méthodes de détection des CNVs. Les résultats n'étant pas complètement satisfaisant, j'ai implémenté ma propre méthode qui donne de meilleures performances que deux des trois autres méthodes utilisées. Je me suis aussi intéressé aux stratégies pour combiner les CNVs de différents individus en régions.Je me suis aussi intéressé à l'impact clinique des CNVs dans le cas des maladies génétiques communes (chapitre 4). Ce projet fut possible grâce à une étroite collaboration avec le Centre Hospitalier Universitaire Vaudois (CHUV) et l'Impérial College à Londres. Dans ce projet, j'ai été l'un des analystes principaux et j'ai travaillé sur l'impact clinique d'une délétion rare du chromosome 16p11 présente chez des patients atteints d'obésité. Dans cette collaboration multidisciplinaire, nous avons comparés 8'456 patients atteint d'obésité et 11 '856 individus de la population générale. Nous avons trouvés que la délétion était impliquée dans 0.7% des cas d'obésité morbide et était absente chez les contrôles sains (non-atteint d'obésité). Notre étude illustre l'importance des CNVs rares qui peuvent avoir un impact clinique très important. De plus, ceci permet d'envisager une alternative aux études d'associations pour améliorer notre compréhension de l'étiologie des maladies génétiques communes.Egalement, j'ai travaillé sur la détection d'altérations somatiques en nombres de copies (SCNA) et de leurs conséquences pour le cancer (chapitre 5). Ce projet fut une collaboration initiée par l'Institut Ludwig de Recherche contre le Cancer et impliquant l'Institut Suisse de Bioinformatique, le CHUV et les Universités de Lausanne et Genève. Je me suis concentré sur l'identification de gènes affectés par des SCNAs et avec une sur- ou sous-expression dans des lignées cellulaires dérivées de mélanomes métastatiques. Les données utilisées ont été générées par des puces ADN (CGH et SNP) et du séquençage à haut débit du transcriptome. Mes recherches ont montrées que peu de gènes sont récurrents entre les mélanomes, ce qui rend difficile l'interprétation des résultats. Pour contourner ces limitations, j'ai utilisé une analyse de réseaux pour définir si des réseaux de signalisations enrichis en gènes amplifiés ou perdus, étaient communs aux différents échantillons. En fait, parmi les 28 réseaux détectés, quatre réseaux sont potentiellement dérégulés chez six mélanomes, et six réseaux supplémentaires sont affectés chez cinq mélanomes. La validation de ces résultats avec deux larges jeux de données publiques, a confirmée tous ces réseaux sauf trois. Ceci démontre l'utilité de cette approche pour l'analyse de petits et de larges jeux de données.Résumé grand publicL'avènement de la biologie moléculaire, en particulier ces dix dernières années, a révolutionné la recherche en génétique médicale. Grâce à la disponibilité du génome humain de référence dès 2001, de nouvelles technologies telles que les puces à ADN sont apparues et ont permis d'étudier le génome dans son ensemble avec une résolution dite sous-microscopique jusque-là impossible par les techniques traditionnelles de cytogénétique. Un des exemples les plus importants est l'étude des variations structurales du génome, en particulier l'étude du nombre de copies des gènes. Il était établi dès 1959 avec l'identification de la trisomie 21 par le professeur Jérôme Lejeune que le gain d'un chromosome supplémentaire était à l'origine de syndrome génétique avec des répercussions graves pour la santé du patient. Ces observations ont également été réalisées en oncologie sur les cellules cancéreuses qui accumulent fréquemment des aberrations en nombre de copies (telles que la perte ou le gain d'un ou plusieurs chromosomes). Dès 2004, plusieurs groupes de recherches ont répertorié des changements en nombre de copies dans des individus provenant de la population générale (c'est-à-dire sans symptômes cliniques visibles). En 2006, le Dr. Richard Redon a établi la première carte de variation en nombre de copies dans la population générale. Ces découvertes ont démontrées que les variations dans le génome était fréquentes et que la plupart d'entre elles étaient bénignes, c'est-à-dire sans conséquence clinique pour la santé de l'individu. Ceci a suscité un très grand intérêt pour comprendre les variations naturelles entre individus mais aussi pour mieux appréhender la prédisposition génétique à certaines maladies.Lors de ma thèse, j'ai développé de nouveaux outils informatiques pour l'analyse de puces à ADN dans le but de cartographier ces variations à l'échelle génomique. J'ai utilisé ces outils pour établir les variations dans la population suisse et je me suis consacré par la suite à l'étude de facteurs pouvant expliquer la prédisposition aux maladies telles que l'obésité. Cette étude en collaboration avec le Centre Hospitalier Universitaire Vaudois a permis l'identification d'une délétion sur le chromosome 16 expliquant 0.7% des cas d'obésité morbide. Cette étude a plusieurs répercussions. Tout d'abord elle permet d'effectuer le diagnostique chez les enfants à naître afin de déterminer leur prédisposition à l'obésité. Ensuite ce locus implique une vingtaine de gènes. Ceci permet de formuler de nouvelles hypothèses de travail et d'orienter la recherche afin d'améliorer notre compréhension de la maladie et l'espoir de découvrir un nouveau traitement Enfin notre étude fournit une alternative aux études d'association génétique qui n'ont eu jusqu'à présent qu'un succès mitigé.Dans la dernière partie de ma thèse, je me suis intéressé à l'analyse des aberrations en nombre de copies dans le cancer. Mon choix s'est porté sur l'étude de mélanomes, impliqués dans le cancer de la peau. Le mélanome est une tumeur très agressive, elle est responsable de 80% des décès des cancers de la peau et est souvent résistante aux traitements utilisés en oncologie (chimiothérapie, radiothérapie). Dans le cadre d'une collaboration entre l'Institut Ludwig de Recherche contre le Cancer, l'Institut Suisse de Bioinformatique, le CHUV et les universités de Lausanne et Genève, nous avons séquencés l'exome (les gènes) et le transcriptome (l'expression des gènes) de sept mélanomes métastatiques, effectués des analyses du nombre de copies par des puces à ADN et des caryotypes. Mes travaux ont permis le développement de nouvelles méthodes d'analyses adaptées au cancer, d'établir la liste des réseaux de signalisation cellulaire affectés de façon récurrente chez le mélanome et d'identifier deux cibles thérapeutiques potentielles jusqu'alors ignorées dans les cancers de la peau.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Summary : Internal ribosome entry sites (IRES) are used by viruses as a strategy to bypass inhibition of cap-dependent translation that commonly results from viral infection. IRES are also used in eukaryotic cells to control mRNA translation under conditions of cellular stress (apoptosis, heat shock) or during the G2 phase of the cell cycle when general protein synthesis is inhibited. Variation in cellular expression levels has been shown to be inherited. Expression is controlled, among others, by transcriptional factors and by the efficiency of cap-mediated translation and ribosome activity. We aimed at identifying genomic determinants of variability in IRES-mediated translation of two representative IRES [Encephalomyocarditis virus (EMCV) and X-linked Inhibitor-of-Apoptosis (XIAP) IRES]. We used bicistronic lentiviral constructions expressing two fluorescent reporter transgenes. Lentiviruses were used to transduce seven different laboratory cell lines and B lymphoblastoid cell lines from the Centre d'Etude du Polymorphisme Humain (CEPH; 15 pedigrees; n=209); representing an in vitro approach to family structure allowing genome scan analyses. The relative expression of the two markers was assessed by FACS. IRES efficiency varies according to cellular background, but also varies, for a same cell type, among individuals. The control of IRES activity presents an inherited component (h2) of 0.47 and 0.36 for EMCV and XIAP IRES, respectively. A genome scan identified a suggestive Quantitative Trait Loci (LOD 2.35) involved in the control of XIAP IRES activity. Résumé : Les sites internes d'entrée des ribosomes (IRES = internal ribosome entry sites) sont utilisés par les virus comme une stratégie afin d'outrepasser l'inhibition de traduction qui résulte communément d'une infection virale. Les IRES sont également utilisés par les cellules eucaryotes pour contrôler la traduction de l'ARN messager dans des conditions de stress cellulaire (apoptose, choc thermique) ou durant la phase G2 du cycle cellulaire, situations durant lesquelles la synthèse générale des protéines est inhibée. La variation des niveaux d'expression cellulaire de transcription est un caractère héréditaire. L'expression des gènes est contrôlée entre autre par les facteurs de transcription et par l'efficacité de la traduction initiée par la coiffe ainsi que par l'activité des ribosomes. Durant cette étude nous avons eu pour but d'identifier les déterminants génomiques responsables de la variabilité de la traduction contrôlée par l'IRES. Ceci a été effectué en étudiant deux IRES représentatifs : l'IRES du virus de l'encéphalomyocardite (EMCV) et l'IRES de l'inhibiteur de l'apoptose XIAP (X-linked Inhibitor-of-Apoptosis). Nous avons utilisés des lentivirus délivrant un transgène bicistronique codant pour deux gènes rapporteurs fluorescents. Ces lentivirus ont été utilisés pour transduire sept différentes lignées cellulaires de laboratoire et des lignées cellulaires lymphoblastoïdes B du Centre d'Etude du Polymorphisme Humain (CEPH; 15 pedigrees; n=209) qui représentent une approche in vitro de la structure familiale et qui permettent des analyses par balayage du génome. L'expression relative des deux marqueurs fluorescents a été analysée par FACS. Nos résultats montrent que l'efficacité des IRES varie en fonction du type de cellules. Il varie aussi, pour le même type de cellules, selon les individus. Le contrôle de l'activité de l'IRES est un caractère héritable (héritabilité h2) de 0.47 et 0.36 pour les IRES de EMCV et XIAP respectivement. Le balayage du génome a permis l'identification d'un locus à effets quantitatifs [QTL Quantitative Trait Loci (LOD 2.35)] impliqué dans le contôle de l'activité de l'IRES de XIAP.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

SUMMARY Genomic imprinting is an epigenetic mechanism of transcriptional regulation that ensures restriction of expression of a subset of mammalian genes to a single parental allele. The best studied example of imprinted gene regulation is the Igf2/H19 locus, which is also the most commonly altered by loss of imprinting (LOT) in cancer. LOT is associated with numerous hereditary diseases and several childhood, and adult cancers. Differential expression of reciprocal H19 and 1gf2 alleles in somatic cells depends on the methylation status of the imprinting control region (ICR) which regulates binding of CTCF, an ubiquitously expressed 11-zinc finger protein that binds specifically to non-methylated maternal ICR and thereby attenuates expression of Igf2, while it does not bind to methylated paternal ICR, which enables Igf2 expression. Initial ICR methylation occurs during gametogenesis by an as yet unknown mechanism. The accepted hypothesis is that the event of differential maternal and paternal DNA methylation depends on germ-line specific proteins. Our Laboratory identified a novel 11-zinc-finger protein CTCF-T (also known as CTCFL and BORIS) that is uniquely expressed in the male germ-line and is highly homologous within its zinc-finger region with CTCF. The amino-acid sequences flanking the zinc-finger regions of CTCF and CTCF-T have widely diverged, suggesting that though they could bind to the same DNA targets (ICRs) they are likely to have different functions. Interestingly, expression of CTCF-T and CTCF is mutually exclusive; CTCF-T-positive (CTCF-negative) cells occur in the stage of spermatogenesis that coincides with epigenetic reprogramming, including de novo DNA methylation. In our study we demonstrate the role that CTCF-T plays in genomic imprinting. Here we show that CTCF-T binds in vivo to the ICRs of Igf2/H19 and Dlk/Gt12 imprinted genes. In addition, we identified two novel proteins interacting with CTCF-T: a protein arginine methyltransferase PRMT7 and an arginine-rich histone H2A variant that we named trH2A. These interactions were confirmed and show that the two proteins interact with the amino-teiminal region of CTCF-T. Additionally, we show interaction of the amino- terminal region of CTCF-T with histones H1, H2A and H3. These results suggest that CTCF-T is a sequence-specific DNA (ICR) binding protein that associates with histones and recruits PRMT7. Interestingly, PRMT7 has a histone-methyltransferase activity. It has been shown that histone methylation can mark chromatin regions thereby directing DNA-methylation; thus, our hypothesis is that the CTCF-T protein-scaffold directs PRMT7 to methylate histone(s) assembled on ICRs, which marks chromatin for the recruitment of the de novo DNA methyltransferases to methylate DNA. To test this hypothesis, we developed an in vivo DNA-methylation assay using Xenopus laevis' oocytes, where H19 ICR and different expression cDNAs, including CTCF-T, PRMT7 and the de novo DNA methyltransferases (Dnmt3a, Dnmt3b and Dnmt3L) are microinjected into the nucleus. The methylation status of CpGs within the H19 ICR was analysed 48 or 72 hours after injection. Here we demonstrate that CpGs in the ICR are methylated in the presence of both CTCF-T and PRMT7, while control oocytes injected only with ICR did not show any methylation. Additionally, we showed for the first time that Dnmt3L is crucial for the establishment of the imprinting marks on H19 ICR. Moreover, we confirmed that Dnmt3a and Dnmt3b activities are complementary. Our data indicate that all three Dnmt3s are important for efficient de novo DNA methylation. In conclusion, we propose a mechanism for the establishment of de novo imprinting marks during spermatogenesis: the CTCF-T/PRMT7 protein complex directs histone methylation leading to sequence-specific de novo DNA methylation of H19 ICR. RESUME L'empreinte génomique parentale est un mécanisme épigénétique de régulation transcriptionelle qui se traduit par une expression différentielle des deux allèles de certains gènes, en fonction de leur origine parentale. L'exemple le mieux caractérisé de gènes soumis à l'empreinte génomique parentale est le locus Igf2/H19, qui est aussi le plus fréquemment altéré par relaxation d'empreinte (en anglais: loss of imprinting, LOI) dans les cancers. Cette relaxation d'empreinte est aussi associée à de nombreuses maladies héréditaires, ainsi qu'à de nombreux cancers chez l'enfant et l'adulte. Dans les cellules somatiques, les différences d'expression des allèles réciproques H19 et Ig12 est sous le contrôle d'une région ICR (Imprinting Control Region). La méthylation de cette région ICR régule l'ancrage de la protéine à douze doigts de zinc CTCF, qui se lie spécifiquement à l'ICR maternel non-méthylé, atténuant ainsi l'expression de Igf2, alors qu'elle ne s'ancre pas à l'ICR paternel méthyle. Le mécanisme qui accompagne la méthylation initiale de la région ICR durant la gamétogenèse n'a toujours pas été élucidé. L'hypothèse actuelle propose que la différence de méthylation entre l'ADN maternel et paternel résulte de l'expression de protéines propres aux zones germinales. Notre laboratoire a récemment identifié une nouvelle protéine à douze doigts de zinc, CTCF-T (aussi dénommée CTCFL et BORRIS), qui est exprimée uniquement dans les cellules germinales mâles, dont la partie à douze doigts de zinc est fortement homologue à la protéine CTCF. La séquence d'acides aminés de part et d'autre de cette région est quant à elle très divergente, ce qui implique que CTCF-T se lie sans doute au même ADN cible que CTCF, mais possède des fonctions différentes. De plus, l'expression de CTCF-T et de CTCF s'oppose mutuellement; l'expression de la protéine CTCF-T (cellules CTCF-T positives, CTCF negatives) qui a lieu pendant la spermatogenèse coïncide avec la reprogrammation épigénétique, notamment la méthylation de novo de l'ADN. La présente étude démontre le rôle essentiel joué par la protéine CTCF-T dans l'acquisition de l'empreinte génomique parentale. Nous montrons ici que CTCF-T s'associe in vivo avec les régions ICR des loci Igf2/H19 et Dlk/Gt12. Nous avons également identifié deux nouvelles protéines qui interagissent avec CTCF-T : une protéine arginine méthyl transférase PRMT7, et un variant de l'histone H2A, riche en arginine, que nous avons dénommé trH2A. Ces interactions ont été analysées plus en détail, et confinnent que ces deux protéines s'associent avec la région N-terminale de CTCF-T. Aussi, nous présentons une interaction de la région N-terminale de CTCF-T avec les histones H1, H2, et H3. Ces résultats suggèrent que CTCF-T est une protéine qui se lie spécifiquement aux régions ICR, qui s'associe avec différents histones et qui recrute PRMT7. PRMT7 possède une activité méthyl-tansférase envers les histones. Il a été montré que la méthylation des histones marque certains endroits de la chromatine, dirigeant ainsi la méthylation de l'ADN. Notre hypothèse est donc la suivante : la protéine CTCF-T sert de base qui dirige la méthylation des histones par PRMT7 dans les régions ICR, ce qui contribue à marquer la chromatine pour le recrutement de nouvelles méthyl transférases pour méthyler l'ADN. Afin de valider cette hypothèse, nous avons développé un système de méthylation de l'ADN in vivo, dans des oeufs de Xenopus laevis, dans le noyau desquels nous avons mico-injecté la région ICR du locus H19, ainsi que différents vecteurs d'expression pour CTCF-T, PRMT7, et les de novo méthyl transférases (Dnmt3a, Dnmt3b et Dnmt3L). Les CpGs méthyles de la région ICR du locus H19 ont été analysé 48 et 72 heures après l'injection. Cette technique nous a permis de démontrer que les CpGs de la région ICR sont méthyles en présence de CTCF-T et de PRMT7, tandis que les contrôles injectés seulement avec la région ICR ne présentent aucun signe de méthylation. De plus, nous démontrons pour la première fois que la protéine méthyl transférase Dnmt3L est déterminant pour l'établissement de l'empreinte génomique parentale au niveau de la région ICR du locus H19. Aussi, nous confirmons que les activités méthyl transférases de Dnmt3a et Dnmt3b sont complémentaires. Nos données indiquent que les trois protéines Dnmt3 sont impliquées dans la méthylation de l'ADN. En conclusion, nous proposons un mécanisme responsable de la mise en place de nouvelles empreintes génomiques pendant la spermatogenèse : le complexe protéique CTCF-T/PRMT7 dirige la méthylation des histones aboutissant à la méthylation de novo de l'ADN au locus H19.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

SUMMARY : Eukaryotic DNA interacts with the nuclear proteins using non-covalent ionic interactions. Proteins can recognize specific nucleotide sequences based on the sterical interactions with the DNA and these specific protein-DNA interactions are the basis for many nuclear processes, e.g. gene transcription, chromosomal replication, and recombination. New technology termed ChIP-Seq has been recently developed for the analysis of protein-DNA interactions on a whole genome scale and it is based on immunoprecipitation of chromatin and high-throughput DNA sequencing procedure. ChIP-Seq is a novel technique with a great potential to replace older techniques for mapping of protein-DNA interactions. In this thesis, we bring some new insights into the ChIP-Seq data analysis. First, we point out to some common and so far unknown artifacts of the method. Sequence tag distribution in the genome does not follow uniform distribution and we have found extreme hot-spots of tag accumulation over specific loci in the human and mouse genomes. These artifactual sequence tags accumulations will create false peaks in every ChIP-Seq dataset and we propose different filtering methods to reduce the number of false positives. Next, we propose random sampling as a powerful analytical tool in the ChIP-Seq data analysis that could be used to infer biological knowledge from the massive ChIP-Seq datasets. We created unbiased random sampling algorithm and we used this methodology to reveal some of the important biological properties of Nuclear Factor I DNA binding proteins. Finally, by analyzing the ChIP-Seq data in detail, we revealed that Nuclear Factor I transcription factors mainly act as activators of transcription, and that they are associated with specific chromatin modifications that are markers of open chromatin. We speculate that NFI factors only interact with the DNA wrapped around the nucleosome. We also found multiple loci that indicate possible chromatin barrier activity of NFI proteins, which could suggest the use of NFI binding sequences as chromatin insulators in biotechnology applications. RESUME : L'ADN des eucaryotes interagit avec les protéines nucléaires par des interactions noncovalentes ioniques. Les protéines peuvent reconnaître les séquences nucléotidiques spécifiques basées sur l'interaction stérique avec l'ADN, et des interactions spécifiques contrôlent de nombreux processus nucléaire, p.ex. transcription du gène, la réplication chromosomique, et la recombinaison. Une nouvelle technologie appelée ChIP-Seq a été récemment développée pour l'analyse des interactions protéine-ADN à l'échelle du génome entier et cette approche est basée sur l'immuno-précipitation de la chromatine et sur la procédure de séquençage de l'ADN à haut débit. La nouvelle approche ChIP-Seq a donc un fort potentiel pour remplacer les anciennes techniques de cartographie des interactions protéine-ADN. Dans cette thèse, nous apportons de nouvelles perspectives dans l'analyse des données ChIP-Seq. Tout d'abord, nous avons identifié des artefacts très communs associés à cette méthode qui étaient jusqu'à présent insoupçonnés. La distribution des séquences dans le génome ne suit pas une distribution uniforme et nous avons constaté des positions extrêmes d'accumulation de séquence à des régions spécifiques, des génomes humains et de la souris. Ces accumulations des séquences artéfactuelles créera de faux pics dans toutes les données ChIP-Seq, et nous proposons différentes méthodes de filtrage pour réduire le nombre de faux positifs. Ensuite, nous proposons un nouvel échantillonnage aléatoire comme un outil puissant d'analyse des données ChIP-Seq, ce qui pourraient augmenter l'acquisition de connaissances biologiques à partir des données ChIP-Seq. Nous avons créé un algorithme d'échantillonnage aléatoire et nous avons utilisé cette méthode pour révéler certaines des propriétés biologiques importantes de protéines liant à l'ADN nommés Facteur Nucléaire I (NFI). Enfin, en analysant en détail les données de ChIP-Seq pour la famille de facteurs de transcription nommés Facteur Nucléaire I, nous avons révélé que ces protéines agissent principalement comme des activateurs de transcription, et qu'elles sont associées à des modifications de la chromatine spécifiques qui sont des marqueurs de la chromatine ouverte. Nous pensons que lés facteurs NFI interagir uniquement avec l'ADN enroulé autour du nucléosome. Nous avons également constaté plusieurs régions génomiques qui indiquent une éventuelle activité de barrière chromatinienne des protéines NFI, ce qui pourrait suggérer l'utilisation de séquences de liaison NFI comme séquences isolatrices dans des applications de la biotechnologie.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Les polymorphismes génétiques ayant un impact sur la biotransformation des xénobiotiques et sur leurs effets biologiques sont le sujet d'étude de la pharmacogénétique. Actuellement, on s'intéresse de plus en plus à la perspective de réaliser des prescriptions individualisées dans tous les domaines de la médecine et également en psychiatrie. Une telle promesse pourrait être réalisable grâce aux connaissances accumulées par l'implémentation des techniques génomiques en pharmacogénétique. Parallèlement à la baisse des coûts et de la durée des analyses, une meilleure compréhension de certains enjeux cliniques et économiques peut faciliter cette implémentation dans la pratique psychiatrique quotidienne dans un avenir proche.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

AbstractThe Chlamydiales order is an important bacterial phylum that comprises some of the most successful human pathogens such as Chlamydia trachomatis, the leading infectious cause of blindness worldwide. Since some years, several new bacteria related to Chlamydia have been discovered in clinical or environmental samples and might represent emerging pathogens. The genome sequencing of classical Chlamydia has brought invaluable information on these obligate intracellular bacteria otherwise difficult to study due to the lack of tools to perform basic genetic manipulation. The recent emergence of high-throughput sequencing technologies yielding millions of reads in a short time lowered the costs of genome sequencing and thus represented a unique opportunity to study Chlamydia-re\ated bacteria. Based on the sequencing and the analysis of Chlamydiales genomes, this thesis provides significant insights into the genetic determinants of the intracellular lifestyle, the pathogenicity, the metabolism and the evolution of Chlamydia-related bacteria. A first approach showed the efficacy of rapid sequencing coupled to proteomics to identify immunogenic proteins. This method, particularly useful for an emerging pathogen such as Parachlamydia acanthamoebae, enabled us to discover good candidates for the development of diagnostic tools that would permit to evaluate at larger scale the role of this bacterium in disease. Second, the complete genome of Waddlia chondrophila, a potential agent of miscarriage, encodes numerous virulence factors to manipulate its host cell and resist to environmental stresses. The reconstruction of metabolic pathways showed that the bacterium possesses extensive capabilities compared to related organisms. However, it is still incapable of synthesizing some essential components and thus has to import them from its host. Third, the genome comparison of Protochlamydia naegleriophila to its closest known relative Protochlamydia amoebophila revealed a particular evolutionary dynamic with the occurrence of an unexpected genome rearrangement. Fourth, a phylogenetic analysis of P. acanthamoebae and Legionella drancourtii identified several genes probably exchanged by horizontal gene transfer with other intracellular bacteria that might occur within their amoebal host. These genes often encode mechanisms for resistance to metal or toxic compounds. As a whole, the analysis of the different genomes enabled us to highlight a large diversity in size, GC percentage, repeat content as well as plasmid organization. The abundant genomic data obtained during this thesis have a wide impact since they provide the necessary bases for detailed investigations on countless aspects of the biology and the evolution of Chlamydia-related bacteria, whether in wet lab or by bioinformatical analyses.RésuméL'ordre des Chlamydiales est un important phylum bactérien qui comprend de nombreuses espèces pathogènes pour l'homme et les animaux, dont Chlamydia trachomatis, responsable du trachome, la cause majeure de cécité d'origine infectieuse à travers le monde. Durant ces dernières décennies, de nombreuses bactéries apparentées aux Chlamydia ont été découvertes dans des échantillons environnementaux ou cliniques mais leur éventuel rôle pathogène dans le développement de maladies reste peu connu. Ces bactéries sont des intracellulaires obligatoires car elles ont besoin d'une cellule hôte pour se multiplier, ce qui rend leur étude particulièrement difficile. Le développement de nouvelles technologies permettant de séquencer le génome d'un organisme rapidement et à moindre coût ainsi que l'essor des méthodes d'analyse s'y rapportant représentent une opportunité exceptionnelle d'étudier ces organismes. Dans ce contexte, cette thèse démontre l'utilité de la génomique pour développer de nouveaux outils diagnostiques ainsi que pour étudier le métabolisme de ces bactéries, leurs facteurs de virulence et leur évolution.Ainsi, une première approche a illustré l'utilité d'un séquençage rapide pour obtenir les informations nécessaires à l'identification de protéines qui sont reconnues par des anticorps humains ou animaux. Cette méthode, particulièrement utile pour un pathogène émergent tel que Parachlamydia acanthamoebae, a permis de découvrir de bons candidats pour le développement d'un outil diagnostique qui permettrait d'évaluer à plus large échelle le rôle de cette bactérie notamment dans la pneumonie. L'analyse du contenu génique de Waddlia chondrophila, un autre germe qui pourrait être impliqué dans les avortements et tes fausses-couches, a en outre mis en évidence la présence de nombreux facteurs connus qui lui permettent de manipuler son hôte. Cette bactérie possède de plus grandes capacités métaboliques que les autres Chlamydia, mais elle est incapable de synthétiser certains composants et doit donc les importer de son hôte pour subvenir à ses besoins. La comparaison du génome de Protochlamydia naegleriophila à son plus proche parent, Protochlamydia amoebophila, a dévoilé une évolution dynamique particulière avec l'occurrence d'un réarrangement majeur inattendu après la séparation de ces deux espèces. En outre, ces études ont montré l'occurrence de plusieurs transferts de gène avec d'autres organismes plus éloignés, notamment d'autres intracellulaires d'amibes, souvent pour l'acquisition de mécanismes de résistances à des composés toxiques. Les données génomiques acquises durant ce travail posent les fondements nécessaires a de nombreuses analyses qui permettront progressivement de mieux comprendre de nombreux aspects de ces bactéries fascinantes.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Abstract : Copy number variation (CNV) of DNA segments has recently gained considerable interest as a source of genetic variation likely to play a role in phenotypic diversity and evolution. Much effort has been put into the identification and mapping of regions that vary in copy number among seemingly normal individuals, both in humans and in a number of model organisms, using both bioinformatic and hybridization-based methods. Synteny studies suggest the existence of CNV hotspots in mammalian genomes, often in connection with regions of segmental duplication. CNV alleles can be in equilibrium within a population, but can also arise de novo between generations, illustrating the highly dynamic nature of these regions. A small number of studies have assessed the effect of CNV on single loci, however, at the genome-wide scale, the functional impact of CNV remains poorly studied. We have explored the influence of CNV on gene expression, first using the Williams-Beuren syndrome (WBS) associated deletion as a model, and second at the genome-wide scale in inbred mouse strains. We found that the WBS deletion influences the expression levels not only of the hemizygous genes, but also affects the euploid genes mapping nearby. Consistently, on a genome wide scale we observe that CNV genes are expressed at more variable levels than genes that do not vary in copy number. Likewise, CNVs influence the relative expression levels of genes that map to the flank of the genome rearrangements, thus globally influencing tissue transcriptomes. Further studies are warranted to complete cataloguing and fine mapping of CNV regions, as well as to elucidate the different mechanisms by which CNVs influence gene expression. Résumé : La variation en nombre de copies (copy number variation ou CNV) de segments d'ADN suscite un intérêt en tant que variation génétique susceptible de jouer un r81e dans la diversité phénotypique et l'évolution. Les régions variables en nombre de copies parmi des individus apparemment normaux ont été cartographiées et cataloguées au moyen de puces à ADN et d'analyse bioinformatique. L'étude de la synténie entre plusieurs espèces de mammifères laisse supposer l'existence de régions à haut taux de variation, souvent liées à des duplications segmentaires. Les allèles CNV peuvent être en équilibre au sein d'une population ou peuvent apparaître de novo. Ces faits illustrent la nature hautement dynamique de ces régions. Quelques études se sont penchées sur l'effet de la variation en nombre de copies de loci isolés, cependant l'impact de ce phénomène n'a pas été étudié à l'échelle génomique. Nous avons examiné l'influence des CNV sur l'expression des gènes. Dans un premier temps nous avons utilisé la délétion associée au syndrome de Williams-Beuren (WBS), puis, dans un second temps, nous avons poursuivi notre étude à l'échelle du génome, dans des lignées consanguines de souris. Nous avons établi que la délétion WBS influence l'expression non seulement des gènes hémizygotes, mais également celle des gènes euploïdes voisins. A l'échelle génomique, nous observons des phénomènes concordants. En effet, l'expression des gènes variant en nombre de copies est plus variable que celles des gènes ne variant pas. De plus, à l'instar de la délétion WBS, les CNV influencent l'expression des gènes adjacents, exerçant ainsi un impact global sur les profils d'expression dans les tissus. Résumé pour un large public : De nombreuses maladies ont pour cause un défaut génétique. Parmi les types de mutations, on compte la disparition (délétion) d'une partie de notre génome ou sa duplication. Bien que l'on connaisse les anomalies associées à certaines maladies, les mécanismes moléculaires par lesquels ces réarrangements de notre matériel génétique induisent les maladies sont encore méconnus. C'est pourquoi nous nous sommes intéressés à la régulation des gènes dans les régions susceptibles à délétion ou duplication. Dans ce travail, nous avons démontré que les délétions et les duplications influencent la régulation des gènes situés à proximité, et que ces changements interviennent dans plusieurs organes.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Recently, the introduction of second generation sequencing and further advance-ments in confocal microscopy have enabled system-level studies for the functional characterization of genes. The degree of complexity intrinsic to these approaches needs the development of bioinformatics methodologies and computational models for extracting meaningful biological knowledge from the enormous amount of experi¬mental data which is continuously generated. This PhD thesis presents several novel bioinformatics methods and computational models to address specific biological questions in Plant Biology by using the plant Arabidopsis thaliana as a model system. First, a spatio-temporal qualitative analysis of quantitative transcript and protein profiles is applied to show the role of the BREVIS RADIX (BRX) protein in the auxin- cytokinin crosstalk for root meristem growth. Core of this PhD work is the functional characterization of the interplay between the BRX protein and the plant hormone auxin in the root meristem by using a computational model based on experimental evidence. Hyphotesis generated by the modelled to the discovery of a differential endocytosis pattern in the root meristem that splits the auxin transcriptional response via the plasma membrane to nucleus partitioning of BRX. This positional information system creates an auxin transcriptional pattern that deviates from the canonical auxin response and is necessary to sustain the expression of a subset of BRX-dependent auxin-responsive genes to drive root meristem growth. In the second part of this PhD thesis, we characterized the genome-wide impact of large scale deletions on four divergent Arabidopsis natural strains, through the integration of Ultra-High Throughput Sequencing data with data from genomic hybridizations on tiling arrays. Analysis of the identified deletions revealed a considerable portion of protein coding genes affected and supported a history of genomic rearrangements shaped by evolution. In the last part of the thesis, we showed that VIP3 gene in Arabidopsis has an evo-lutionary conserved role in the 3' to 5' mRNA degradation machinery, by applying a novel approach for the analysis of mRNA-Seq data from random-primed mRNA. Altogether, this PhD research contains major advancements in the study of natural genomic variation in plants and in the application of computational morphodynamics models for the functional characterization of biological pathways essential for the plant. - Récemment, l'introduction du séquençage de seconde génération et les avancées dans la microscopie confocale ont permis des études à l'échelle des différents systèmes cellulaires pour la caractérisation fonctionnelle de gènes. Le degrés de complexité intrinsèque à ces approches ont requis le développement de méthodologies bioinformatiques et de modèles mathématiques afin d'extraire de la masse de données expérimentale générée, des information biologiques significatives. Ce doctorat présente à la fois des méthodes bioinformatiques originales et des modèles mathématiques pour répondre à certaines questions spécifiques de Biologie Végétale en utilisant la plante Arabidopsis thaliana comme modèle. Premièrement, une analyse qualitative spatio-temporelle de profiles quantitatifs de transcripts et de protéines est utilisée pour montrer le rôle de la protéine BREVIS RADIX (BRX) dans le dialogue entre l'auxine et les cytokinines, des phytohormones, dans la croissance du méristème racinaire. Le noyau de ce travail de thèse est la caractérisation fonctionnelle de l'interaction entre la protéine BRX et la phytohormone auxine dans le méristème de la racine en utilisant des modèles informatiques basés sur des preuves expérimentales. Les hypothèses produites par le modèle ont mené à la découverte d'un schéma différentiel d'endocytose dans le méristème racinaire qui divise la réponse transcriptionnelle à l'auxine par le partitionnement de BRX de la membrane plasmique au noyau de la cellule. Cette information positionnelle crée une réponse transcriptionnelle à l'auxine qui dévie de la réponse canonique à l'auxine et est nécessaire pour soutenir l'expression d'un sous ensemble de gènes répondant à l'auxine et dépendant de BRX pour conduire la croissance du méristème. Dans la seconde partie de cette thèse de doctorat, nous avons caractérisé l'impact sur l'ensemble du génome des délétions à grande échelle sur quatre souches divergentes naturelles d'Arabidopsis, à travers l'intégration du séquençage à ultra-haut-débit avec l'hybridation génomique sur puces ADN. L'analyse des délétions identifiées a révélé qu'une proportion considérable de gènes codant était affectée, supportant l'idée d'un historique de réarrangement génomique modelé durant l'évolution. Dans la dernière partie de cette thèse, nous avons montré que le gène VÏP3 dans Arabidopsis a conservé un rôle évolutif dans la machinerie de dégradation des ARNm dans le sens 3' à 5', en appliquant une nouvelle approche pour l'analyse des données de séquençage d'ARNm issue de transcripts amplifiés aléatoirement. Dans son ensemble, cette recherche de doctorat contient des avancées majeures dans l'étude des variations génomiques naturelles des plantes et dans l'application de modèles morphodynamiques informatiques pour la caractérisation de réseaux biologiques essentiels à la plante. - Le développement des plantes est écrit dans leurs codes génétiques. Pour comprendre comment les plantes sont capables de s'adapter aux changements environnementaux, il est essentiel d'étudier comment leurs gènes gouvernent leur formation. Plus nous essayons de comprendre le fonctionnement d'une plante, plus nous réalisons la complexité des mécanismes biologiques, à tel point que l'utilisation d'outils et de modèles mathématiques devient indispensable. Dans ce travail, avec l'utilisation de la plante modèle Arabidopsis thalicinci nous avons résolu des problèmes biologiques spécifiques à travers le développement et l'application de méthodes informatiques concrètes. Dans un premier temps, nous avons investigué comment le gène BREVIS RADIX (BRX) régule le développement de la racine en contrôlant la réponse à deux hormones : l'auxine et la cytokinine. Nous avons employé une analyse statistique sur des mesures quantitatives de transcripts et de produits de gènes afin de démontrer que BRX joue un rôle antagonisant dans le dialogue entre ces deux hormones. Lorsque ce-dialogue moléculaire est perturbé, la racine primaire voit sa longueur dramatiquement réduite. Pour comprendre comment BRX répond à l'auxine, nous avons développé un modèle informatique basé sur des résultats expérimentaux. Les simulations successives ont mené à la découverte d'un signal positionnel qui contrôle la réponse de la racine à l'auxine par la régulation du mouvement intracellulaire de BRX. Dans la seconde partie de cette thèse, nous avons analysé le génome entier de quatre souches naturelles d'Arabidopsis et nous avons trouvé qu'une grande partie de leurs gènes étaient manquant par rapport à la souche de référence. Ce résultat indique que l'historique des modifications génomiques conduites par l'évolution détermine une disponibilité différentielle des gènes fonctionnels dans ces plantes. Dans la dernière partie de ce travail, nous avons analysé les données du transcriptome de la plante où le gène VIP3 était non fonctionnel. Ceci nous a permis de découvrir le rôle double de VIP3 dans la régulation de l'initiation de la transcription et dans la dégradation des transcripts. Ce rôle double n'avait jusqu'alors été démontrée que chez l'homme. Ce travail de doctorat supporte le développement et l'application de méthodologies informatiques comme outils inestimables pour résoudre la complexité des problèmes biologiques dans la recherche végétale. L'intégration de la biologie végétale et l'informatique est devenue de plus en plus importante pour l'avancée de nos connaissances sur le fonctionnement et le développement des plantes.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

The complexity of mammalian genome organization demands a complex interplay of DNA and proteins to orchestrate proper gene regulation. CTCF, a highly conserved, ubiquitously expressed protein has been postulated as a primary organizer of genome architecture because of its roles in transcriptional activation/repression, insulation and imprinting. Diverse regulatory functions are exerted through genome wide binding via a central eleven zinc finger DNA binding domain and an array of diverse protein-protein interactions through N- and C- terminal domains. CTCFL has been identified as a paralog of CTCF expressed only in spermatogenic cells of the testis. CTCF and CTCFL have a highly homologous DNA-binding domain, while the flanking amino acid sequences exhibit no significant similarity. Genome- wide mapping of CTCF binding sites has been carried out in many cell types, but no data exist for CTCFL apart from a few identified loci. The lack of high quality antibodies prompted us to generate an endogenously flag-tagged CTCFL mouse model using BAC recombination. IHC staining using anti-flag antibodies confirmed CTCFL localization to type Β spermatogonia and preleptotene spermatocytes and a mutually exclusive pattern of expression with CTCF. ChIP followed by high-throughput sequencing identified 10,382 binding sites showing 70% overlap but representing only 20% of CTCF sites. Consensus sequence analysis identified a significantly longer binding motif with prominently less ambiguity of base calling at every position. The significant difference between CTCF and CTCFL genomic binding patterns proposes that their binding to DNA is differentially regulated. Analysis of CTCFL binding to methylated regions on a genome wide scale identified approximately 1,000 loci. Methylation-independent binding of CTCFL might be at least one of the mechanisms that ensures distinct binding patterns of CTCF and CTCFL since CTCF binding is methylation- sensitive. Co-localization of CTCF with cohesin has been well established and analysis of CTCFL and SMC3 overlap identified around 3,300 binding sites from which two related but distinct consensus sequence motifs were derived. Because virtually all data for cohesin binding originate from mitotically proliferating cells, the anticipated overlap is expected to be considerably higher in meiotic cells. Meiosis-specific cohesin subunit Rec8 is specific for spermatocytes and 6 out of the 12 identified binding sites are also bound by CTCFL. In conclusion, this was the first genome-wide mapping of CTCFL binding sites in spermatocytes, the only cell type where CTCF is not expressed. CTCFL has a unique binding site repertoire distinct from CTCF, binds to methylated sequences and shows a significant overlap with cohesin binding sites. Future efforts will be oriented towards deciphering the role CTCFL plays in conversion of chromatin structure and function from mitotic to meiotic chromosomes. - La complexité de l'organisation du génome des mammifères exige une interaction particulière entre ADN et protéines pour orchestrer une régulation appropriée de l'expression des gènes. CTCFL, une protéine ubiquitaire très conservée, serait le principal organisateur de l'architecture du génome de par son rôle dans l'activation / la répression de la transcription, la protection et la localisation des gènes. Diverses régulations sont opérées, d'une part au travers d'interactions à différents endroits du génome par le biais d'un domaine protéique central de liaison à l'ADN à onze doigts de zinc, et d'autre part par des interactions protéine-protéine variées au niveau de leur domaine N- et C-terminal. CTCFL a été identifié comme un paralogue de CTCF exprimé uniquement dans les cellules spermatiques du testicule. CTCFL et CTCF ont un domaine de liaison à l'ADN très homologue, tandis que les séquences d'acides aminés situées de part et d'autre de ce domaine ne présentent aucune similitude. Une cartographie générale des sites de liaison au CTCF a été réalisée pour de nombreux types cellulaires, mais il n'existe aucune donnée pour CTCFL à l'exception de l'identification de quelques loci. L'absence d'anticorps de bonne qualité nous a conduit à générer un modèle murin portant un CTCFL endogène taggué grâce à un procédé de recombinaison BAC. Une coloration IHC à l'aide d'anticorps anti-FLAG a confirmé la présence de CTCFL au niveau des spermatogonies de type Β et des spermatocytes au stade préleptotène, et une distribution mutuellement exclusive avec CTCF. Une méthode de Chromatine Immunoprecipitation (ChIP) suivie d'un séquençage à haut débit a permis d'identifier 10.382 sites de liaison montrant 70% d'homologie mais ne représentant que 20% des sites CTCF. L'analyse de la séquence consensus révèle un motif de fixation à l'ADN nettement plus long et qui comporte bien moins de bases aléatoires à chaque position nucléotidique. La différence significative entre les séquences génomiques des sites de liaison au CTCF et CTCFL suggère que leur fixation à l'ADN est régulée différemment. Appliquée à l'échelle du génome, l'étude de l'interaction de CTCFL avec des régions méthylées de l'ADN a permis d'identifier environ 1.000 loci. Contrairement à CTCFL, la liaison de CTCF dépend de l'état de méthylation de l'ADN ; cette modification épigénétique constitue donc au moins un des mécanismes de régulation expliquant une localisation de CTCF et CTCFL à des sites distincts du génome. La co- localisation de CTCF avec la cohésine étant établie, l'analyse de la superposition des séquences de CTCFL avec la sous-unité SMC3 identifie environ 3.300 sites de liaison parmi lesquels deux mêmes motifs consensus distincts par leur séquence sont mis en évidence. La presque quasi-totalité des données sur la cohésine ayant été établie à partir de cellules en prolifération mitotique, il est probable que la similitude au sein des séquences consensus soit encore plus grande dans le cas des cellules en méiose. La sous-unité Rec8 de la cohésine propre à l'état de méiose est spécifiquement exprimée dans les spermatocytes. Or 6 des 12 sites de liaison identifiés sont également utilisés par CTCFL. Pour conclure, ce travail constitue la première cartographie à l'échelle du génome des sites de liaison de CTCFL dans les spermatocytes, seul type cellulaire où CTCFL n'est pas exprimé. CTCFL possède un répertoire unique de sites de fixation à l'ADN distinct de CTCF, se lie à des séquences méthylées et présente un nombre important de sites de liaison communs avec la cohésine. Les perspectives futures sont d'élucider le rôle de CTCFL dans le remodelage de la structure de la chromatine et de définir sa fonction dans le processus de méiose.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Le fonctionnement du système nerveux est sensible aux variations de la concentration d'acide. Une acidification des tissus peut se produire pendant une activité neuronale intense ou dans des situations physiopathologiques telles que l'inflammation ou les lésions cérébrales. Les canaux ioniques sensibles à l'acide (ASIC) sont activés par acidification et jouent un rôle important dans la détection des changements d'acide. Les ASICs contribuent à la dégénérescence neuronale après une lésion cérébrale, puisque leur inhibition limite la lésion neuronale. L'acidification induite par une inflammation du tissu nerveux conduit à des stimuli de douleur, qui sont détectés par ces canaux. En effet, les toxines qui bloquent spécifiquement les ASICs montrent des effets analgésiques dans des modèles animaux. La structure 3D d'ASIC peut être comparée à une main qui tient une boule entre son pouce et le doigt. Les différents domaines d'ASIC sont appelés doigt, pouce, jointure, boule-ß et paume. Les domaines transmembranaires représentent le poignet de cette main. Mon projet de thèse vise à décrire les mouvements survenant sur ce canal pendant son activité. A cet effet, j'ai utilisé une technique combinée qui permet la mesure des mouvements en temps réel durant l'activité du canal. J'ai montré les réarrangements des domaines extracellulaires pendant l'activité ASIC. Ces mouvements sont transmis au pore du canal, ou ils contrôlent sa fermeture et ouverture. La direction de ces mouvements a été évaluée pour les domaines doigt et jointure, et nous avons montré qu'ils s'éloignent de la boule-ß lors de l'acidification. J'ai également été en mesure de décrire les mouvements qui se produisent dans la poche acidique, une zone qui est considérée comme importante, car elle représente le site de liaison de certaines toxines de venin qui agissent sur les ASICs. J'ai ainsi pu montrer que les domaines doigt et le pouce qui forment la poche acidique se rapprochent l'un de l'autre pendant l'activation du canal. Ces résultats sont en accord avec des observations précédentes réalisées sur les ASICs par d'autres chercheurs. Enfin, cette analyse approfondie permet d'améliorer les connaissances sur le contrôle de l'activité ASIC; de plus, les mécanismes trouvés ici sont probablement partagés entre les canaux de la famille à laquelle appartiennent les ASICs. -- Les acid-sensing ion channels (ASICs) sont des canaux sodiques ouverts par les protons et principalement exprimés dans le système nerveux. Ils sont impliqués dans la détection des protons dans de nombreux états physiologiques et pathologiques comme l'ischémie et la perception de la douleur. La structure cristalline de l'isoforme ASIC1 de poulet a été déterminée dans l'état désensibilisé et ouvert. Les études fonctionnelles indiquent que la protonation des résidus clés dans la boucle extracellulaire déclenche des changements de conformation conduisant à l'ouverture du canal. Cependant, les mécanismes moléculaires qui relient la protonation à l'ouverture et la fermeture du canal n'ont pas encore été clarifiés. Dans cette étude, nous avons utilisé la voltage-clamp fluorimétrie (VCF) pour révéler les mouvements de l'activité associée qui se produisent dans les différents domaines de l'ASICla. Les fluorophores positionnés dans le pouce, la paume, le doigt, l'articulation et dans les domaines de l'entrée du pore extracellulaire ont montré des signaux de VCF liés à des changements de conformation au cours de l'activité du canal. La synchronisation des changements de fluorescence indique une séquence complexe de mouvements en fonction du pH. La cinétique de la fluorescence et des signaux de courant ont été comparés les uns aux autres afin de déterminer si le mouvement détecté par le signal de fluorescence correspond à une transition fonctionnelle définie du canal. Certains des résidus testés se sont révélés être étroitement liés à la désensibilisation du canal ou au rétablissement après la désensibilisation. En outre, nous avons trouvé qu'un tryptophane endogène de la boule-ß diminue le signal de fluorescence des sondes positionnées dans les domaines doigt et jointure. L'augmentation observée de ces signaux indique que ces domaines s'éloignent à une distance à partir de la boucle de la boule-ß. Sur la base de ce principe, nous avons généré des paires Trp-Cys « quencher», dans lequel le Cys est utilisé comme site d'ancrage pour attacher le fluorophore. Ensuite, nous avons évalué les changements de conformation qui se produisent au niveau de la poche acide, une zone importante pour la fonction et la régulation d'ASIC. Les signaux de fluorescence indiquent un mouvement de l'hélice supérieure du pouce vers le doigt et une rotation de la boule-ß dans le sens horaire. L'analyse de la cinétique indique que les mouvements des sous-domaines qui composent la poche acide se produisent pendant la désensibilisation du canal. Mon projet de doctorat représente la première analyse approfondie des changements conformationnels dépendants de l'activité des ASICs et fournit des informations sur les mécanismes de contrôle de l'activité du canal qui sont probablement partagés avec d'autres canaux proches.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Pneumocystis jirovecii is a fungus belonging to a basal lineage of the Ascomycotina, the Taphrinomycotina subphylum. It is a parasite specific to humans that dwells primarily in the lung and can cause severe pneumonia in individuals with debilitated immune system. Despite its clinical importance, many aspects of its biology remain poorly understood, at least in part because of the lack of a continuous in vitro cultivation system. The present thesis consists in the genome reconstruction and comparative genomics of P. jirovecii. It is made of three parts: (i) the de novo sequencing of P. jirovecii genome starting from a single broncho- alveolar lavage fluid of a single patient (ii) the de novo sequencing of the genome of the plant pathogen Taphrina deformans, a fungus closely related to P. jirovecii, and (iii) the genome scale comparison of P. jirovecii to other Taphrinomycotina members. Enrichment in P. jirovecii cells by immuno-precipitation, whole DNA random amplification, two complementary high throughput DNA sequencing methods, and in silico sorting and assembly of sequences were used for the de novo reconstruction of P. jirovecii genome from the microbiota of a single clinical specimen. An iterative ad hoc pipeline as well as numerical simulations was used to recover P. jirovecii sequences while purging out contaminants and assembly or amplification chimeras. This strategy produced a 8.1 Mb assembly, which encodes 3,898 genes. Homology searches, mapping on biochemical pathways atlases, and manual validations revealed that this genome lacks (i) most of the enzymes dedicated to the amino acids biosyntheses, and (ii) most virulence factors observed in other fungi, e.g. the glyoxylate shunt pathway and specific peptidases involved in the degradation of the host cell membrane. The same analyses applied to the available genomic sequences from Pneumocystis carinii the species infecting rats and Pneumocystis murina the species infecting mice revealed the same deficiencies. The genome sequencing of T. deformans yielded a 13 Mb assembly, which encodes 5,735 genes. T. deformans possesses enzymes involved plant cell wall degradation, secondary metabolism, the glyoxylate cycle, detoxification, sterol biosynthesis, as well as the biosyntheses of plant hormones such as abscisic acid or indole-3-acetic acid. T. deformans also harbors gene subsets that have counterparts in plant saprophytes or pathogens, which is consistent with its alternate saprophytic and pathogenic lifestyles. Mating genes were also identified. The homothallism of this fungus suggests a mating-type switching mechanism. Comparative analyses indicated that 81% of P. jirovecii genes are shared with eight other Taphrinomycotina members, including T. deformans, P. carinii and P. murina. These genes are mostly involved in housekeeping activities. The genes specific to the Pneumocystis genus represent 8%, and are involved in RNA metabolism and signaling. The signaling is known to be crucial for interaction of Pneumocystis spp with their environment. Eleven percent are unique to P. jirovecii and encode mostly proteins of unknown function. These genes in conjunction with other ones (e.g. the major surface glycoproteins) might govern the interaction of P. jirovecii with its human host cells, and potentially be responsible of the host specificity. P. jirovecii exhibits a reduced genome in size with a low GC content, and most probably scavenges vital compounds such as amino acids and cholesterol from human lungs. Consistently, its genome encodes a large set of transporters (ca. 22% of its genes), which may play a pivotal role in the acquisition of these compounds. All these features are generally observed in obligate parasite of various kingdoms (bacteria, protozoa, fungi). Moreover, epidemiological studies failed to evidence a free-living form of the fungus and Pneumocystis spp were shown to co-evolved with their hosts. Given also the lack of virulence factors, our observations strongly suggest that P. jirovecii is an obligate parasite specialized in the colonization of human lungs, and which causes disease only in individuals with compromised immune system. The same conclusion is most likely true for all other Pneumocystis spp in their respective mammalian host. - Pneumocystis jirovecii est un champignon appartenant à ine branche basale des Ascomycotina, le sous-embranchement des Taphrinomycotina. C'est un parasite spécifique aux humains qui réside principalement dans les poumons, et qui peut causer des pneumonies sévères chez des individus ayant un système immunitaire déficient. En dépit de son importance clinique, de nombreux aspects de sa biologie demeurent,largement méconnus, au moins en partie à cause de l'absence d'un système de culture in vitro continu. Cette thèse traite de la reconstruction du génome et de la génomique comparative de P. jirovecii. Elle comporte trois parties: (i) le séquençage de novo du génome de P. jirovecii à partir d'un lavage broncho-alvéolaire provenant d'un seul patient, (ii) le séquençage de novo du génome d'un champignon pathogène de plante Taphrina deformans qui est phylogénétiquement proche de P. jirovecii, et (iii) la comparaison du génome de P. jirovecii à celui d'autres membres du sous-embranchement des Taphrinomycotina. Un enrichissement en cellules de P. jirovecii par immuno-précipitation, une amplification aléatoire des molécules d'ADN, deux méthodes complémentaires de séquençage à haut débit, un tri in silico et un assemblage des séquences ont été utilisés pour reconstruire de novo le génome de P. jirovecii à partir du microbiote d'un seul échantillon clinique. Un pipeline spécifique ainsi que des simulations numériques ont été utilisés pour récupérer les séquences de P. jirovecii tout en éliminant les séquences contaminants et les chimères d'amplification ou d'assemblage. Cette stratégie a produit un assemblage de 8.1 Mb, qui contient 3898 gènes. Les recherches d'homologies, de cartographie des voies métaboliques et des validations manuelles ont révélé que ce génome est dépourvu (i) de la plupart des enzymes dédiées à la biosynthèse des acides aminés, et (ii) de la plupart des facteurs de virulence observés chez d'autres champignons, par exemple, le cycle du glyoxylate ainsi que des peptidases spécifiques impliquées dans la dégradation de la membrane de la cellule hôte. Les analyses appliquées aux données génomiques disponibles de Pneumocystis carinii, l'espèce infectant les rats, et de Pneumocystis murina, l'espèce infectant les souris, ont révélé les mêmes déficiences. Le séquençage du génome de T. deformans a généré un assemblage de 13.3 Mb qui contient 5735 gènes. T. deformans possède les gènes codant pour les enzymes impliquées dans la dégradation des parois cellulaires des plantes, le métabolisme secondaire, le cycle du glyoxylate, la détoxification, la biosynthèse des stérols ainsi que la biosynthèse d'hormones de plantes telles que l'acide abscissique ou l'acide indole 3-acétique. T. deformans possède également des sous-ensembles de gènes présents exclusivement chez des saprophytes ou des pathogènes de plantes, ce qui est consistent avec son mode de vie alternatif saprophyte et pathogène. Des gènes impliqués dans la conjugaison ont été identifiés. L'homothallisme de ce champignon suggère mécanisme de permutation du type conjuguant. Les analyses comparatives ont démontré que 81% des gènes de P. jirovecii sont présent chez les autres membres du sous-embranchement des Taphrinomycotina. Ces gènes sont essentiellement impliqués dans le métabolisme basai. Les gènes spécifiques au genre Pneumocystis représentent 8%, et sont impliqués dans le métabolisme de l'ARN et la signalisation. La signalisation est connue pour être cruciale pour l'interaction des espèces de Pneumocystis avec leur environnement. Les gènes propres à P. jirovecii représentent 11% et codent en majorité pour des protéines dont la fonction est inconnue. Ces gènes en conjonction avec d'autres (par exemple, les glycoprotéines de surface), pourraient être déterminants dans l'interaction de P. jirovecii avec les cellules de l'hôte humain, et être potentiellement responsable de la spécificité d'hôte. P. jirovecii possède un génome de taille réduite à faible pourcentage en GC et récupère très probablement des composés vitaux comme les acides aminés et le cholestérol à partir des poumons humains. De manière consistante, son génome code pour de nombreux transporteurs (22% de ses gènes), qui pourraient jouer un rôle essentiel dans l'acquisition de ces composés. Ces caractéristiques sont généralement observées chez les parasites obligatoires de plusieurs règnes (bactéries, protozoaires, champignons). De plus, les études épidémiologiques n'ont pas réussi à prouver l'existence d'ime forme vivant librement du champignon. Etant donné également l'absence de facteurs de virulence, nos observations suggèrent que P. jirovecii est un parasite obligatoire spécialisé dans la colonisation des poumons humains, ne causant une maladie que chez des individus ayant un système immunitaire compromis. La même conclusion est très probablement applicable à toutes les autres espèces de Pneumocystis dans leur hôte mammifère respectif.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

Transgene expression in eukaryotic cells strongly depends on the locus of integration in the host genome and often results in limited transcription level because of unfavorable chromatin structure at the integration site. Epigenetic regulators are DNA sequences which are believed to act on the chromatin structure and may protect transgenes from this so-called position effect. Despite being extensively used to increase transgene expression, the mechanism of action of many of these elements remains largely unknown. Here we evaluated different epigenetic regulatory DNA elements for their ability to protect transgene transcription at telomeres, a defined chromatin environment associated to low or inconsistent expression caused by the Telomere Position Effect (TPE). For the assessment of the effects of epigenetic regulators at telomeres, a novel dual reporter system had to be designed. Telomeric integration of the newly-developed dual reporter system carrying different epigenetic regulators showed that MARs (Matrix Attachment Regions), a UCOE (Ubiquitous Chromatin-Opening Element) or the chicken cHS4 insulator have strong barrier activity which prevented TPE from spreading toward the centromere, resulting in stable and in some cases increased expression of a telomeric-distal reporter gene. In addition, MARs and STAR element 40 resulted in an increase of cells expressing the telomeric-proximal reporter gene, suggesting also an anti-silencing effect. Chromatin immunoprecipitation assays revealed that at telomeres MARs actively promote the deposition of euchromatic histone marks, especially acetylation of both histone H3 and H4, which might be involved in MARs' barrier and transcriptional activator activities. Differently, the chromatin in proximity of the UCOE element was depleted of several repressive chromatin marks, such as trimethylated lysine 9 and lysine 27 on histone H3 and trimethylated lysine 20 of histone H4, possibly favoring the preservation of an open chromatin structure at the integration site. We conclude that epigenetic regulatory elements that may be used to enhance and sustain transgene expression have all a specific epigenetic signature which might be at the basis of their mechanism of action, and that a combination of different classes of epigenetic regulators might be advantageous when high levels of protein expression are required. - L'expression des transgènes dans les cellules eucaryotes est fortement influencée par leur site d'intégration dans le génome. En effet, une structure chromatinienne défavorable au niveau du site d'intégration peut fortement limiter le degré d'expression d'un transgène. Il existe toutefois des séquences d'ADN qui, en agissant sur la structure de la chromatine, permettent de limiter cet effet de position et, par conséquent, de promouvoir l'expression soutenue d'un transgène. Ces éléments génomiques, connus comme régulateurs épigénétiques, sont largement utilisés dans plusieurs domaines où une expression élevée et soutenue est requise, malgré un mode de fonctionnement parfois méconnu. Dans cette étude, j'ai évalué la capacité de différents régulateurs épigénétiques à protéger la transcription de transgènes au niveau des télomères, régions chromatiniennes bien définies qui ont été associées à un fort effet de silençage, connu comme «effet de position télomérique». Pour cela, un nouveau système à deux gènes rapporteurs a été développé. Lorsque des MARs (Matrix Attachment Regions, séquences d'ADN pouvant s'associer à la matrice nucléaire), un UCOE (Ubiquitous Chromatin-Opening Element, élément pouvant ouvrir la chromatine) ou l'isolateur génétique cHS4 (dérivé du locus de la β-globine de poulet) sont placés entre les deux gènes rapporteurs, une forte activité barrière bloquant la propagation de la chromatine répressive télomérique est observée, résultant en un plus grand nombre de cellules exprimant le gène télomérique-distal. D'autre part, une augmentation du nombre de cellules exprimant le gène télomérique-proximal, observée en présence des éléments MAR et STAR 40 (Stabilizing Anti-Repressor element 40, un élément pouvant prévenir la répression génique), suggère aussi un faible effet anti-silençage pour ces éléments. Des expériences d'immunoprécipitation de la chromatine démontrent qu'au télomère, les MARs favorisent l'assemblage de marqueurs de la chromatine active, surtout l'acétylation des histones H3 et H4, qui pourraient être à la base de l'activité barrière et de celle d'activateur transcriptionel. Différemment, la chromatine à proximité de l'élément UCOE est particulièrement pauvre en marqueurs de la chromatine silencieuse, comme la trimethylation des lysines 9 et 27 de l'histone H3, ainsi que la trimethylation de la lysine 20 de l'histone H4. Cela suggère que UCOE pourrait préserver une structure chromatinienne ouverte au site d'intégration, favorisant l'expression des gènes à sa proximité. En conclusion, les régulateurs épigénétiques analysés lors de cette étude ont tous montré une signature épigénétique spécifique qui pourrait être à la base de leurs mécanismes de fonctionnement, suggérant aussi qu'une utilisation d'éléments épigénétiques de classe différente dans un même vecteur d'expression pourrait être avantageuse lorsque de hauts et soutenus niveaux d'expression sont nécessaires.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

PR0X1 est un facteur de transcription très conservé au cours de l'évolution. PROX1 joue un rôle essentiel dans de nombreuses étapes de l'embryogenèse, telles que le développement du système lymphatique ou la migration des hépatocytes. Récemment, il a été démontré que PROX1 contribue à la progression des tumeurs colorectales, en tant que gène cible de la voie de signalisation Wnt. En utilisant des approches de co- immunoprécipitation et de ligature de proximité, nous avons trouvé que PROX1 fait également partie du complexe transcriptionnel TCF/ß-catenin, à la fois dans les cellules humaines de cancer du colon et dans les cellules murines de l'épithélium de l'intestin, dans lesquelles la voie de signalisation Wnt est activée. Dans le but de comprendre le mécanisme d'action de PROX1, nous avons analysé le génome des cellules cancéreuses de colon à la recherche des sites de fixation de PROX1, TCF4 et ß-catenin. Nous avons ainsi pu montrer que TCF4, ß-catenin et PROX1 se fixent simultanément sur une sous- population d'amplificateurs génomiques, sur lesquels PROX1 agit comme répresseur. Ces résultats suggèrent que, spécifiquement dans le cadre du cancer du colon, PROX1 agit en tant que modificateur de la voie de transduction du signal Wnt/ß-catenin. De plus, nous proposons que ceci constitue un des mécanismes par lesquels la signalisation durable de Wnt, qui est observée dans la majorité des cancers du colon, transforme le programme génétique des progéniteurs intestinaux, initialement normal, en output spécifique de ce type de cancers, ce qui contribue plus tard à la croissance infinie de la tumeur, à son caractère invasif et à sa dissémination.

Relevância:

10.00% 10.00%

Publicador:

Resumo:

ABSTRACT The role of chromosomal rearrangements in the speciation process is much debated and many theoretical models have been developed. The shrews of the Sorex araneus group offer extraordinary opportunities to study the relationship between chromosomal variation and speciation. Indeed, this group of morphologically very similar species received a great deal of attention due to its karyotypic variability, which is mainly attributed to Robertsonian fusions. To explore the impact of karyotypic changes on genetic differentiation, we first studied the relationship between genetic and karyotypic structure among Alpine species and among chromosome races of the S. araneus group using Bayesian admixture analyses. The results of these analyses confirmed the taxonomic status of the studied species even though introgression can still be detected between species. Moreover, the strong spatial sub-structure highlighted the role of historical factors (e.g. geographical isolation) on genetic structure. Next, we studied gene flow at the chromosome level to address the question of the impact of chromosomal rearrangements on genetic differentiation. We used flow sorted chromosomes from three different karyotypic taxa of the S. araneus group to map microsatellite markers at the chromosóme arm level. We have been able to map 24 markers and to show that the karyotypic organisation of these taxa is well conserved, which suggests that these markers can be used for further inter-taxa studies. A general prediction of chromosomal speciation models is that genetic differentiation between two taxa should be larger across rearranged chromosomes than across chromosomes common to both taxa. We combined two approaches using mapped microsatellites to test this prediction. First, we studied the genetic differentiation among five shrew taxa placed at different evolutionary levels (i.e. within and among species). In this large scale study, we detected an overall significant difference in genetic structure between rearranged vs. common chromosomes. Moreover, this effect varied among pairwise comparisons, which allowed us to differentiate the role of the karyotypic complexity of hybrids and of the evolutionary divergence between taxa. Secondly, we compared the levels of gene flow measured across common vs. rearranged chromosomes in two karyotypically different hybrid zones (strong vs. low complexity of hybrids), which show similar levels of genetic structure. We detected a significantly stronger genetic structure across rearranged chromosomes in the hybrid zone showing the highest level of hybrid complexity. The large variance observed among loci suggested that other factors, such as the position of markers within the chromosome, also certainly affects genetic structure. In conclusion, our results strongly support the role of chromosomal rearrangements in the reproductive barrier and suggest their importance in speciation process of the S. araneus group. RESUME Le rôle des réarrangements chromosomiques dans les processus de spéciation est fortement débattu et de nombreux modèles théoriques ont été développés sur le sujet. Les musaraignes du groupe Sorex araneus présentent de nombreuses opportunités pour étudier les relations entre les variations chromosomiques et la spéciation. En effet, ce groupe d'espèces morphologiquement très proches a attiré l'attention des chercheurs en raison de sa variabilité caryotypique principalement attribuée à des fusions Robertsoniennes. Pour explorer l'impact des changements caryotypiques sur la différenciation génétique, nous avons tout d'abord étudié les relations entre la structure génétique et caryotypique de races chromosomiques et d'espèces alpine du groupe S. araneus en utilisant des analyses Bayesiennes d' « admixture ». Les résultats de ces analyses ont confirmé le statut taxonomique des espèces étudiées bien que nous ayons détecté de l'introgression entre espèces. L'observation d'une sous structure spatiale relativement forte souligne l'importance des facteurs historiques (telle que l'isolation géographique) sur la structure génétique de ce groupe. Ensuite, nous avons étudié le flux de gène au niveau des chromosomes pour aborder de manière directe la question de l'impact des réarrangements chromosomiques sur la différenciation génétique. En conséquence, nous avons utilisé des tris de chromosomes de trois taxons du groupe S. araneus pour localiser des marqueurs microsatellites au niveau du bras chromosomique. Au cours de cette étude, nous avons pu localiser 24 marqueurs et montrer une forte conservation dans l'organisation du caryotype de ces taxa. Ce résultat suggère que leur utilisation est appropriée pour des études entre taxa. Une prédiction générale à tous les modèles de spéciation chromosomique correspond à la plus grande différenciation génétique des chromosomes réarrangés que des chromosomes communs. Nous avons combiné deux approches utilisant des microsatellites localisés au niveau du bras chromosomique pour tester cette prédiction. Premièrement, nous avons étudié la différenciation génétique entre cinq taxa du groupe S. araneus se trouvant à des niveaux évolutifs différents (i.e. à l'intérieur et entre espèce). Au cours de cette étude, nous avons détecté une différenciation globale significativement plus élevée sur les chromosomes réarrangés. Cet effet varie entre les comparaisons, ce qui nous a permis de souligner le rôle de la complexité caryotypique des hybrides et du niveau de divergence évolutive entre taxa. Deuxièmement, nous avons comparé le flux de gènes des chromosomes communs et réarrangés dans deux zones d'hybridation caryotypiquement différentes (forte vs. Faible complexité des hybrides) mais présentant un niveau de différenciation génétique similaire. Ceci nous a permis de détecter une structure génétique significativement plus élevée sur les chromosomes réarrangés au centre de la zone d'hybridation présentant la plus grande complexité caryotypic. La forte variance observée entre loci souligne en outre le fait que d'autres facteurs, tel que la position du marqueur sur le chromosome, affectent probablement aussi la structure génétique mesurée. En conclusion, nos résultats supportent fortement le rôle des réarrangements chromosomiques dans la barrière reproductive entre espèces ainsi que leur importance dans les processus de spéciation des musaraignes du groupe S. araneus.