993 resultados para conserved noncoding sequence
Resumo:
Affiliation: Zhujun Ao, Éric Cohen & Xiaojian Yao : Département de microbiologie et immunologie, Faculté de Médecine, Université de Montréal
Resumo:
Affiliation: Département de microbiologie et immunologie, Faculté de médecine, Université de Montréal
Resumo:
Affiliation: Département de biochimie, Faculté de médecine, Université de Montréal
Resumo:
La sécrétion des protéines est un processus essentiel à la vie. Chez les eucaryotes, les protéines sécrétées transitent dans le réticulum endoplasmique par le pore de translocation. Le translocon est composé de trois sous-unités fondamentales nommées Sec61α, β et γ chez les mammifères, ou Sec61p, Sbh1p et Sss1p chez les levures. Tandis que le rôle des sous-unités α et γ est bien connu, celui de la sous-unité β demeure énigmatique. Plusieurs phénotypes distincts sont associés à cette protéine dans différents organismes, mais le haut niveau de conservation de séquence suggère plutôt une fonction universelle conservée. Récemment, Feng et al. (2007) ont montré que le domaine transmembranaire (TMD) de Sbh1p était suffisant pour complémenter plusieurs phénotypes associés à la délétion du gène chez Saccharomyces cerevisiae, suggérant un rôle important de cette région. L’objectif de mon projet de recherche consiste à étudier la fonction biologique de la sous-unité β du translocon et de son TMD chez Schizosaccharomyces pombe. Dans cette levure, j’ai découvert que le gène sbh1+ n’était pas essentiel à la viabilité à 30oC, mais qu’il était requis pour la croissance à basse température. La délétion de sbh1+ entraîne une sensibilité aux stress de la paroi cellulaire et une diminution de la sécrétion des protéines à 23oC. La surexpression de Sbh1p diminue elle aussi la sécrétion des protéines et altère la morphologie cellulaire. Ces phénotypes sont distincts de ceux observés chez S. cerevisiae, où la délétion des deux paralogues de Sec61β entraîne une sensibilité à haute température plutôt qu’à basse température. Malgré cela, les homologues de Sec61β de S. pombe et de S. cerevisiae sont tout deux capables de complémenter la thermosensibilité respective de chaque levure. La complémentation est possible même avec l’homologue humain de Sec61β, indiquant la conservation d’une fonction de Sec61β de la levure à l’homme. Remarquablement, le TMD de Sec61β de S. pombe, de S. cerevisiae et de l’humain sont suffisants pour complémenter la délétion génomique autant chez la levure à fission que chez la levure à bourgeons. Globalement, ces observations indiquent que le TMD de Sec61β exerce une fonction cellulaire conservée à travers les espèces.
Resumo:
Une cascade de facteurs de transcription composée de SIM1, ARNT2, OTP, BRN2 et SIM2 est requise pour la différenciation des cinq types cellulaires qui peuplent le noyau paraventriculaire (PVN) de l’hypothalamus, un régulateur critique de plusieurs processus physiologiques essentiels à la survie. De plus, l’haploinsuffisance de Sim1 est aussi une cause d’hyperphagie isolée chez la souris et chez l’homme. Nous désirons disséquer le programme développemental du PVN, via une approche intégrative, afin d’identifier de nouveaux gènes qui ont le potentiel de réguler l’homéostasie chez l’individu adulte. Premièrement, nous avons utilisé une approche incluant l’analyse du transcriptome du PVN à différents stades du développement de la souris pour identifier de tels gènes. Nous avons comparé les transcriptomes de l’hypothalamus antérieur chez des embryons de souris Sim1+/+ et Sim1-/- à E12.5 issus de la même portée. De cette manière, nous avons identifié 56 gènes agissant en aval de Sim1 dont 5 facteurs de transcription - Irx3, Sax1, Rxrg, Ror et Neurod6. Nous avons également proposé un modèle de développement à deux couches de l’hypothalamus antérieur. Selon ce modèle, les gènes qui occupent un domaine médial dans la zone du manteau caractérisent des cellules qui peupleront le PVN alors que les gènes qui ont une expression latérale identifient des cellules qui donneront plus tard naissance aux structures ventrolatérales de l’hypothalamus. Nous avons aussi démontré que Sim1 est impliqué à la fois dans la différenciation, la migration et la prolifération des neurones qui peuplent le PVN tout comme Otp. Nous avons également isolé par microdissection au laser le PVN et l’hypothalamus médiobasal chez des souris de type sauvage à E14.5 pour en comparer les transcriptomes. Ceci nous a permis d’identifier 34 facteurs de transcription spécifiques au PVN et 76 facteurs spécifiques à l’hypothalamus médiobasal. Ces gènes représentent des régulateurs potentiels du développement hypothalamique. Deuxièmement, nous avons identifié 3 blocs de séquences au sein de la région 5’ d’Otp qui sont conservés chez l’homme, la souris et le poisson. Nous avons construit un transgène qui est composé d’un fragment de 7 kb contenant ces blocs de séquences et d’un gène rapporteur. L’analyse de 4 lignées de souris a montré que ce transgène est uniquement exprimé dans le PVN en développement. Nous avons généré un deuxième transgène dans lequel le fragment de 7 kb est inséré en amont de l’ADNc de Brn2 ou Sim1 et de Gfp. Nous avons obtenu quatre lignées de souris dans lesquels le profil d’expression de Brn2 et de Gfp reproduit celui d’Otp. Nous étudierons le développement du PVN et la prise alimentaire chez ces souris. En parallèle, nous croisons ces lignées avec les souris déficientes en Sim1 pour déterminer si l’expression de Brn2 permet le développement des cellules du PVN en absence de Sim1. En résumé, nous avons généré le premier transgène qui est exprimé spécifiquement dans le PVN. Ce transgène constitue un outil critique pour la dissection du programme développemental de l’hypothalamus. Troisièmement, nous avons caractérisé le développement de l’hypothalamus antérieur chez l’embryon de poulet qui représente un modèle intéressant pour réaliser des études de perte et de gain de fonction au cours du développement de cette structure. Il faut souligner que le modèle de développement à deux couches de l’hypothalamus antérieur semble être conservé chez l’embryon de poulet où il est aussi possible de classer les gènes selon leur profil d’expression médio-latéral et le devenir des régions qu’ils définissent. Finalement, nous croyons que cette approche intégrative nous permettra d’identifier et de caractériser des régulateurs du développement du PVN qui pourront potentiellement être associés à des pathologies chez l’adulte telles que l’obésité ou l’hypertension.
Resumo:
Les plantes doivent assurer la protection de trois génomes localisés dans le noyau, les chloroplastes et les mitochondries. Si les mécanismes assurant la réparation de l’ADN nucléaire sont relativement bien compris, il n’en va pas de même pour celui des chloroplastes et des mitochondries. Or il est important de bien comprendre ces mécanismes puisque des dommages à l’ADN non ou mal réparés peuvent entraîner des réarrangements dans les génomes. Chez les plantes, de tels réarrangements dans l’ADN mitochondrial ou dans l’ADN chloroplastique peuvent conduire à une perte de vigueur ou à un ralentissement de la croissance. Récemment, notre laboratoire a identifié une famille de protéines, les Whirly, dont les membres se localisent au niveau des mitochondries et des chloroplastes. Ces protéines forment des tétramères qui lient l’ADN monocaténaire et qui accomplissent de nombreuses fonctions associées au métabolisme de l’ADN. Chez Arabidopsis, deux de ces protéines ont été associées au maintien de la stabilité du génome du chloroplaste. On ignore cependant si ces protéines sont impliquées dans la réparation de l’ADN. Notre étude chez Arabidopsis démontre que des cassures bicaténaires de l’ADN sont prises en charge dans les mitochondries et les chloroplastes par une voie de réparation dépendant de très courtes séquences répétées (de cinq à cinquante paires de bases) d’ADN. Nous avons également montré que les protéines Whirly modulent cette voie de réparation. Plus précisément, leur rôle serait de promouvoir une réparation fidèle de l’ADN en empêchant la formation de réarrangements dans les génomes de ces organites. Pour comprendre comment les protéines Whirly sont impliquées dans ce processus, nous avons élucidé la structure cristalline d’un complexe Whirly-ADN. Nous avons ainsi pu montrer que les Whirly lient et protègent l’ADN monocaténaire sans spécificité de séquence. La liaison de l’ADN s’effectue entre les feuillets β de sous-unités contiguës du tétramère. Cette configuration maintient l’ADN sous une forme monocaténaire et empêche son appariement avec des acides nucléiques de séquence complémentaire. Ainsi, les protéines Whirly peuvent empêcher la formation de réarrangements et favoriser une réparation fidèle de l’ADN. Nous avons également montré que, lors de la liaison de très longues séquences d’ADN, les protéines Whirly peuvent s’agencer en superstructures d’hexamères de tétramères, formant ainsi des particules sphériques de douze nanomètres de diamètre. En particulier, nous avons pu démontrer l’importance d’un résidu lysine conservé chez les Whirly de plantes dans le maintien de la stabilité de ces superstructures, dans la liaison coopérative de l’ADN, ainsi que dans la réparation de l’ADN chez Arabidopsis. Globalement, notre étude amène de nouvelles connaissances quant aux mécanismes de réparation de l’ADN dans les organites de plantes ainsi que le rôle des protéines Whirly dans ce processus.
Resumo:
L’ubiquitin-fold modifier (UFM1) fait partie de la classe 1 de la famille de protéine ubiquitin-like (Ubl). UFM1 et Ub ont très peu d’homologie de séquence, mais partagent des similarités remarquables au niveau de leur structure tertiaire. Tout comme l’Ub et la majorité des autres Ubls, UFM1 se lie de façon covalente à ses substrats par l’intermédiaire d’une cascade enzymatique. Il est de plus en plus fréquemment rapporté que les protéines Ubls sont impliquées dans des maladies humaines. Le gène Ufm1 est surexprimé chez des souris de type MCP développant une ischémie myocardique et dans les îlots de Langerhans de patients atteints du diabète de type 2. UFM1 et ses enzymes spécifiques, UBA5, UFL1 et UFC1, sont conservés chez les métazoaires et les plantes suggérant un rôle important pour les organismes multicellulaires. Le Caenorhabditis elegans est le modèle animal le plus simple utilisé en biologie. Sa morphologie, ses phénotypes visibles et ses lignées cellulaires ont été décrits de façon détaillée. De plus, son cycle de vie court permet de rapidement observer les effets de certains gènes sur la longévité. Ce modèle nous permet de facilement manipuler l’expression du gène Ufm1 et de mieux connaître ses fonctions. En diminuant l’expression du gène ufm-1 chez le C.elegans, par la technique de l’ARN interférence par alimentation, nous n’avons observé aucun problème morphologique grave. Les vers ressemblaient aux vers sauvages et possédaient un nombre de progéniture normal. Cependant, les vers sauvage exposés à l’ARNi d’ufm-1 vivent significativement moins longtemps que les contrôles et ce, de façon indépendante de la voie de signalisation de l’insuline/IGF. Chez le C. elegans la longévité et la résistance au stress cellulaire sont intimement liées. Nous n’avons remarqué aucun effet d’ufm-1 sur le stress thermal, osmotique ou oxydatif, mais il est requis pour la protection contre le stress protéotoxique. Il est également nécessaire au maintien de l’intégrité neuronale au cours du vieillissement des animaux. L’ensemble de nos données nous renseigne sur les fonctions putatives du gène Ufm1.
Resumo:
Dans la cellule, chaque ARNm se doit d’être régulé finement au niveau transcriptionnel, bien entendu, mais également au niveau de sa traduction, de sa dégradation ainsi que de sa localisation intracellulaire, et ce, afin de permettre l’expression de chaque produit protéique au moment et à l’endroit précis où son action est requise. Lorsqu’un mécanisme physiologique est mis de l’avant dans la cellule, il arrive souvent que plusieurs ARNm se doivent d’être régulés simultanément. L’un des moyens permettant d’orchestrer un tel processus est de réguler l’action d’une protéine commune associée à chacun de ces ARNm, via un mécanisme post-traductionnel par exemple. Ainsi l’expression d’un groupe précis d’ARNm peut être régulée finement dans le temps et dans l’espace selon les facteurs protéiques auxquels il est associé. Dans l’optique d’étudier certains de ces complexes ribonucléoprotéiques (mRNP), nous nous sommes intéressés aux isoformes et paralogues de Staufen, une protéine à domaine de liaison à l’ARN double-brin (dsRBD) impliquée dans de nombreux aspects de la régulation post-transcriptionnelle, tels la dégradation, la traduction ou encore la localisation d’ARNm. Chez la drosophile, un seul gène Staufen est exprimé alors que chez les mammifères, il existe deux paralogues de la protéine, soit Stau1 et Stau2, tous deux possédant divers isoformes produits suite à l’épissage alternatif de leur gène. Stau1 et Stau2 sont identiques à 50%. Les deux isoformes de Stau2, Stau259 et Stau262 ne diffèrent qu’en leur extrémité N-terminale. En effet, alors que Stau259 arbore un dsRBD1 tronqué, celui de Stau262 est complet. Ces observations introduisent une problématique très intéressante à laquelle nous nous sommes attaqué : ces différentes protéines, quoique très semblables, font-elles partie de complexes ribonucléoprotéiques distincts ayant des fonctions propres à chacun ou, au contraire, vu cette similarité de séquence, travaillent-elles de concert au sein des mêmes complexes ribonucléoprotéiques? Afin d’adresser cette question, nous avons entrepris d’isoler, à partir de cellules HEK293T, les différents complexes de Stau1 et Stau2 par la technique d’immunoprécipitation. Nous avons isolé les ARNm associés à chaque protéine, les avons identifiés grâce aux micropuces d’ADN et avons confirmé nos résultats par RT-PCR. Malgré la présence d’une population commune d’ARNm associée à Stau1 et Stau2, la majorité des transcrits identifiés furent spécifiques à chaque orthologue. Cependant, nous avons remarqué que les diverses populations d’ARNm participaient aux mêmes mécanismes de régulation, ce qui suggère que ces deux protéines possèdent des rôles complémentaires dans la mise en œuvre de divers phénomènes cellulaires. Au contraire, les transcrits associés à Stau259 et Stau262 sont davantage similaires, indiquant que celles-ci auraient des fonctions plutôt semblables. Ces résultats sont très intéressants, car pour la première fois, nous avons identifié des populations d’ARNm associées aux isoformes Stau155, Stau259 et Stau262. De plus, nous les avons analysées en parallèle afin d’en faire ressortir les populations spécifiques à chacune de ces protéines. Ensuite, connaissant l’importance de Stau2 dans le transport dendritique d’ARNm, nous avons cherché à caractériser les complexes ribonucléoprotéiques neuronaux associés à celle-ci. Dans un premier temps et à l’aide de la technique d’immunoprécipitation, nous avons identifié une population d’ARNm neuronaux associés à Stau2. Plus de 1700 ARNm montraient une présence d’au moins huit fois supérieure dans le précipité obtenu avec l’anticorps anti-Stau2 par rapport à celui obtenu avec le sérum pré-immun. Ces ARNm codent pour des protéines impliquées dans des processus de modifications post-traductionnelles, de traduction, de transport intracellulaire et de métabolisme de l’ARN. De façon intéressante, cette population d’ARNm isolée du cerveau de rat est relativement différente de celle caractérisée des cellules humaines HEK293T. Ceci suggère que la spécificité d’association Stau2-ARNm peut diffèrer d’un tissu à un autre. Dans un deuxième temps, nous avons isolé les protéines présentes dans les complexes ribonucléoprotéiques obtenus de cerveaux de rat et les avons identifiées par analyse en spectrométrie de masse. De cette façon, nous avons identifié au sein des particules de Stau2 des protéines liant l’ARN (PABPC1, hnRNPH1, YB1, hsc70), des protéines du cytosquelette (α- et β-tubuline), de même que la protéine peu caractérisée RUFY3. En poussant davantage la caractérisation, nous avons établi que YB1 et PABPC1 étaient associées à Stau2 grâce à la présence de l’ARN, alors que la protéine hsc70, au contraire, interagissait directement avec celle-ci. Enfin, cette dernière association semble être modulable par l’action de l’ATP. Ce résultat offre de nombreuses possibilités quant à la régulation de la fonction de Stau2 et/ou de son mRNP. Entre autres, cette étude suggère un mécanisme de régulation de la traduction au sein de ces particules. Pour faire suite à la caractérisation des mRNP de Stau, nous avons voulu déterminer au niveau neurophysiologique l’importance de ceux-ci. Comme l’étude de Stau2 avait déjà été entreprise préalablement par un autre laboratoire, nous avons décidé de concentrer notre étude sur le rôle de Stau1. Ainsi, nous avons démontré que celle-ci était nécessaire à la mise en place d’une forme de plasticité synaptique à long terme, la forme tardive de potentialisation à long terme ou L-LTP, dépendante de la transcription et de l’activité des récepteurs NMDA. La transmission de base, de même que la faculté de ces épines à faire de la E-LTP, la forme précoce de potentialisation à long terme, et la dépression à long terme ou LTD sont conservées. Ceci indique que les épines conservent la capacité d’être modulées. Ainsi, l’inhibition de la L-LTP, suite à la sous-expression de Stau1, n’est pas simplement due à la perte d’éléments fonctionnels, mais réside plutôt dans l’incapacité de ceux-ci à induire les changements synaptiques spécifiquement nécessaires à la mise en place de la L-LTP. De plus, au niveau synaptique, la sous-expression de Stau1 réduit à la fois l’amplitude et la fréquence des mEPSC. Ces résultats concordent avec l’observation que la sous-expression de Stau1 augmente significativement la proportion d’épines allongées et filopodales, des épines formant des synapses dites silencieuses. Par le fait même, elle diminue le nombre d’épines fonctionnelles, de forme dite normale. Ainsi, nous avons été en mesure de démontrer que l’absence, au niveau neuronal, de la protéine Stau1 induisait un déficit probable dans la localisation et/ou la traduction d’ARNm responsable de la restructuration de l’épine et de facteurs nécessaires à la mise en place de la L-LTP. En conclusion, nous avons participé à lever le voile sur la composition et l’importance des complexes ribonucléoprotéiques de Stau1 et Stau2. Nous avons identifié des populations distinctes et communes d’ARNm associées aux différents isoformes de Stau, à partir des mRNP présents au sein des cellules HEK293. De plus, nous avons réussi à mettre à l’avant plan certaines composantes des mRNP neuronaux de Stau2, dont un partenaire protéique direct, hsc70, partenaire dont l’association est modulable par l’action de l’ATP, ainsi qu’une population neuronale de transcrits d’ARNm. Enfin, nous avons mis en lumière l’importance de Stau1 dans la morphologie des épines dendritiques ainsi que dans le phénomène de la plasticité synaptique.
Resumo:
Dans un premier temps, nous avons modélisé la structure d’une famille d’ARN avec une grammaire de graphes afin d’identifier les séquences qui en font partie. Plusieurs autres méthodes de modélisation ont été développées, telles que des grammaires stochastiques hors-contexte, des modèles de covariance, des profils de structures secondaires et des réseaux de contraintes. Ces méthodes de modélisation se basent sur la structure secondaire classique comparativement à nos grammaires de graphes qui se basent sur les motifs cycliques de nucléotides. Pour exemplifier notre modèle, nous avons utilisé la boucle E du ribosome qui contient le motif Sarcin-Ricin qui a été largement étudié depuis sa découverte par cristallographie aux rayons X au début des années 90. Nous avons construit une grammaire de graphes pour la structure du motif Sarcin-Ricin et avons dérivé toutes les séquences qui peuvent s’y replier. La pertinence biologique de ces séquences a été confirmée par une comparaison des séquences d’un alignement de plus de 800 séquences ribosomiques bactériennes. Cette comparaison a soulevée des alignements alternatifs pour quelques unes des séquences que nous avons supportés par des prédictions de structures secondaires et tertiaires. Les motifs cycliques de nucléotides ont été observés par les membres de notre laboratoire dans l'ARN dont la structure tertiaire a été résolue expérimentalement. Une étude des séquences et des structures tertiaires de chaque cycle composant la structure du Sarcin-Ricin a révélé que l'espace des séquences dépend grandement des interactions entre tous les nucléotides à proximité dans l’espace tridimensionnel, c’est-à-dire pas uniquement entre deux paires de bases adjacentes. Le nombre de séquences générées par la grammaire de graphes est plus petit que ceux des méthodes basées sur la structure secondaire classique. Cela suggère l’importance du contexte pour la relation entre la séquence et la structure, d’où l’utilisation d’une grammaire de graphes contextuelle plus expressive que les grammaires hors-contexte. Les grammaires de graphes que nous avons développées ne tiennent compte que de la structure tertiaire et négligent les interactions de groupes chimiques spécifiques avec des éléments extra-moléculaires, comme d’autres macromolécules ou ligands. Dans un deuxième temps et pour tenir compte de ces interactions, nous avons développé un modèle qui tient compte de la position des groupes chimiques à la surface des structures tertiaires. L’hypothèse étant que les groupes chimiques à des positions conservées dans des séquences prédéterminées actives, qui sont déplacés dans des séquences inactives pour une fonction précise, ont de plus grandes chances d’être impliqués dans des interactions avec des facteurs. En poursuivant avec l’exemple de la boucle E, nous avons cherché les groupes de cette boucle qui pourraient être impliqués dans des interactions avec des facteurs d'élongation. Une fois les groupes identifiés, on peut prédire par modélisation tridimensionnelle les séquences qui positionnent correctement ces groupes dans leurs structures tertiaires. Il existe quelques modèles pour adresser ce problème, telles que des descripteurs de molécules, des matrices d’adjacences de nucléotides et ceux basé sur la thermodynamique. Cependant, tous ces modèles utilisent une représentation trop simplifiée de la structure d’ARN, ce qui limite leur applicabilité. Nous avons appliqué notre modèle sur les structures tertiaires d’un ensemble de variants d’une séquence d’une instance du Sarcin-Ricin d’un ribosome bactérien. L’équipe de Wool à l’université de Chicago a déjà étudié cette instance expérimentalement en testant la viabilité de 12 variants. Ils ont déterminé 4 variants viables et 8 létaux. Nous avons utilisé cet ensemble de 12 séquences pour l’entraînement de notre modèle et nous avons déterminé un ensemble de propriétés essentielles à leur fonction biologique. Pour chaque variant de l’ensemble d’entraînement nous avons construit des modèles de structures tertiaires. Nous avons ensuite mesuré les charges partielles des atomes exposés sur la surface et encodé cette information dans des vecteurs. Nous avons utilisé l’analyse des composantes principales pour transformer les vecteurs en un ensemble de variables non corrélées, qu’on appelle les composantes principales. En utilisant la distance Euclidienne pondérée et l’algorithme du plus proche voisin, nous avons appliqué la technique du « Leave-One-Out Cross-Validation » pour choisir les meilleurs paramètres pour prédire l’activité d’une nouvelle séquence en la faisant correspondre à ces composantes principales. Finalement, nous avons confirmé le pouvoir prédictif du modèle à l’aide d’un nouvel ensemble de 8 variants dont la viabilité à été vérifiée expérimentalement dans notre laboratoire. En conclusion, les grammaires de graphes permettent de modéliser la relation entre la séquence et la structure d’un élément structural d’ARN, comme la boucle E contenant le motif Sarcin-Ricin du ribosome. Les applications vont de la correction à l’aide à l'alignement de séquences jusqu’au design de séquences ayant une structure prédéterminée. Nous avons également développé un modèle pour tenir compte des interactions spécifiques liées à une fonction biologique donnée, soit avec des facteurs environnants. Notre modèle est basé sur la conservation de l'exposition des groupes chimiques qui sont impliqués dans ces interactions. Ce modèle nous a permis de prédire l’activité biologique d’un ensemble de variants de la boucle E du ribosome qui se lie à des facteurs d'élongation.
Resumo:
Résumé La Ribonucléase P (RNase P) est une enzyme principalement reconnue pour sa participation à la maturation en 5’des ARN de transfert (ARNt). Cependant, d’autres substrats sont reconnus par l’enzyme. En général, la RNase P est composée d’une sous-unité ARN (le P-ARN, codé par le gène rnpB) qui porte le centre actif de l’enzyme et d’une ou de plusieurs sous-unités protéiques (la P-protéine). Les P-ARN chez toutes les bactéries, la majorité des archéobactéries et dans le génome nucléaire de la plupart des eucaryotes, possèdent généralement une structure secondaire très conservée qui inclut le noyau (P1-P4); l’hélice P4 constitue le site catalytique de l’enzyme et l’hélice P1 apparie les extrémités du P-ARN en stabilisant sa structure globale. Les P-ARN mitochondriaux sont souvent moins conservés et difficiles à découvrir. Dans certains cas, les seules régions de structure primaire qui restent conservées sont celles qui définissent le P4 et le P1. Pour la détection des gènes rnpB, un outil de recherche bioinformatique, basé sur la séquence et le profil de structure secondaire, a été développé dans le laboratoire. Cet outil permet le dépistage de toutes les séquences eucaryotes (nucléaires et mitochondriales) du gène avec une très grande confiance (basée sur une valeur statistique, E-value). Chez les champignons, plusieurs ascomycètes encodent un gène rnpB dans leur génome mitochondrial y compris tous les membres du genre d’Aspergillus. Cependant, chez les espèces voisines, Neurospora crassa, Podospora anserina et Sordaria macrospora, une version mitochondriale de ce gène n’existe pas. Au lieu de cela, elles contiennent deux copies nucléaires du gène, légèrement différentes en taille et en contenu nucléotidique. Mon projet a été établi dans le but d’éclaircir l’évolution de la RNase P mitochondriale (mtRNase P) chez ces trois espèces voisines d’Aspergillus. En ce qui concerne les résultats, des modèles de structures secondaires pour les transcrits de ces gènes ont été construits en se basant sur la structure consensus universelle de la sous-unité ARN de la RNase P. Pour les trois espèces, par la comparaison de ces modèles, nous avons établi que les deux copies nucléaires du gène rnpB sont assez distinctes en séquence et en structure pour pouvoir y penser à une spécialisation de fonction de la RNase P. Chez N. crassa, les deux P-ARN sont modifiés probablement par une coiffe et les extrémités 5’, 3’ sont conformes à nos modèles, ayant un P1 allongé. Encore chez N. crassa, nous avons constaté que les deux copies sont transcrites au même niveau dans le cytoplasme et que la plus petite et la plus stable d’entre elles (Nc1) se retrouve dans l’extrait matriciel mitochondrial. Lors du suivi du P-ARN dans diverses sous-fractions provenant de la matrice mitochondriale soluble, Nc1 est associée avec l’activité de la RNase P. La caractérisation du complexe protéique, isolé à partir de la fraction active sur un gel non dénaturant, révèle qu’il contient au moins 87 protéines, 73 d’entre elles ayant déjà une localisation mitochondriale connue. Comme chez la levure, les protéines de ce complexe sont impliquées dans plusieurs fonctions cellulaires comme le processing de l’ADN/ARN, le métabolisme, dans la traduction et d’autres (par exemple : la protéolyse et le repliement des protéines, ainsi que la maintenance du génome mitochondrial). Pour trois protéines, leur fonction est non déterminée.
Resumo:
Le virus de l'hépatite C (VHC) touche 3% de la population mondiale et environ 30% des patients chroniquement infectés développeront une fibrose hépatique. Son génome est un ARN simple brin de polarité positive qui possède un cadre ouvert de lecture flanqué de deux régions non traduites hautement conservées. Différents facteurs peuvent influencer le cycle de réplication du VHC. Deux d’entre eux ont été étudiés dans cette thèse. Tout d'abord, nous nous sommes intéressés à l'effet des structures secondaires et tertiaires du génome sur la réplication du VHC. Les extrémités 5' et 3' du génome contiennent des structures ARN qui régulent la traduction et la réplication du VHC. Le 3'UTR est un élément structural très important pour la réplication virale. Cette région est constituée d’une région variable, d’une séquence poly(U/C) et d’un domaine hautement conservé appelé région X. Des études in vitro ont montré que le 3'UTR possède plusieurs structures ARN double brin. Cependant, les structures ARN telles qu'elles existent dans le 3'UTR dans un contexte de génome entier et dans des conditions biologiques étaient inconnues. Pour élucider cette question, nous avons développé une méthode in situ pour localiser les régions ARN simple brin et double brin dans le 3'UTR du génome du VHC. Comme prédit par les études antérieures, nous avons observé qu’in situ la région X du 3’UTR du génome présente des éléments ARN double brin. Étonnamment, lorsque la séquence poly (U/UC) est dans un contexte de génome entier, cette région forme une structure ARN double brin avec une séquence située en dehors du 3'UTR, suggérant une interaction ARN-ARN distale. Certaines études ont démontré que des structures ARN présentes aux extrémités 5’ et 3' du génome du VHC régulent à la fois la traduction et la réplication du VHC. Cela suggère qu'il y aurait une interaction entre les extrémités du génome qui permettrait de moduler ces deux processus. Dans ce contexte, nous avons démontré l'existence d'une interaction distale ARN-ARN, impliquant le domaine II du 5'UTR et la séquence codante de NS5B du génome du VHC. En outre, nous avons démontré que cette interaction joue un rôle dans la réplication de l'ARN viral. Parallèlement, nous avons étudié l'impact d'une molécule immuno-modulatrice sur la réplication du VHC. La fibrose hépatique est une manifestation majeure de l’infection par le VHC. Hors, il a été montré qu'une molécule immuno-modulatrice appelée thalidomide atténuait la fibrose chez les patients infectés par le VHC. Cependant, son impact sur la réplication virale était inconnu. Ainsi, nous avons étudié l'effet de cette molécule sur la réplication du VHC in vitro et nous avons démontré que la thalidomide active la réplication du virus en inhibant la voie de signalisation de NF-kB. Ces résultats soulignent l’importance de la voie de signalisation NF-kB dans le contrôle de la réplication du VHC, et sont à prendre en considération dans l’établissement d’un traitement contre la fibrose hépatique.
Resumo:
La régulation de l’expression des gènes est ce qui permet à nos cellules de s’adapter à leur environnement, de combattre les infections ou, plus généralement, de produire la quantité exacte de protéine nécessaire pour répondre à un besoin spécifique. Parmi les joueurs les plus importants dans cette régulation de l’expression des gènes on retrouve les microARN (miARN). Ces petits ARN de 22 nucléotides sont présents chez la majorité des espèces multicellulaires et sont responsables du contrôle direct de plus de 30% des gènes exprimant des protéines chez les vertébrés. La famille de miARN lethal-7 (let-7) est composée de miARN parmi les plus connus et ayant des fonctions cruciales pour la cellule. La régulation du niveau des miARN let-7 est essentielle au bon développement cellulaire. La biogenèse de ces miARN, du transcrit primaire jusqu’à leur forme mature, est régulée principalement par Lin28, une protéine pluripotente très conservée. Cette protéine est composée d’un domaine cold shock (CSD) et de deux domaines de liaison au zinc. C’est grâce à ces domaines de liaison à l’ARN que Lin28 peut lier et inhiber la maturation des miARN let-7. L’objectif de cette thèse est de caractériser l’interaction entre Lin28 et le microARN précurseur let-7g afin de mieux comprendre le rôle de cette protéine dans l’inhibition de la biogenèse du miARN. À l’aide de techniques biochimiques et biophysiques, nous avons d’abord défini les principaux déterminants de l’interaction entre Lin28 et la boucle terminale du miARN précurseur let-7g (TL-let-7g). Nous avons conclu que le domaine C-terminal de Lin28, composé d’un motif riche en lysines et arginines ainsi que de deux motifs de liaison au zinc, permet à la protéine de lier spécifiquement et avec haute affinité un renflement riche en guanine conservé chez les précurseurs de la famille let-7. Aussi, parce que la séquence et la spécificité de liaison à l’ARN de ce domaine C-terminal sont semblables à celles de la protéine NCp7 du VIH, nous avons défini ce dernier comme le domaine NCp7-like de Lin28. Par la suite, nous avons caractérisé la multimérisation de trois protéines Lin28 sur la boucle terminale de pre-let-7g. Ceci a permis de réconcilier d’apparentes contradictions retrouvées dans la littérature actuelle concernant les sites de liaison de Lin28 lors de sa liaison aux miARN précurseurs. Nous avons identifié trois sites de liaison à haute affinité sur TL-let-7g qui sont liés dans un ordre précis par trois protéines Lin28. Lors de la formation du complexe multimérique, le CSD permet une déstabilisation de l’ARN, ce qui rend accessible plusieurs sites de liaison. Le domaine NCp7-like permet plutôt un assemblage ordonné de la protéine et facilite la liaison initiale de cette dernière. Ces nouveaux résultats rendent possible la mise au point d’un nouveau modèle de l’interaction entre Lin28 et le miARN précurseur let-7g. En conclusion, les études réalisées dans cette thèse apportent une meilleure compréhension des mécanismes moléculaires impliqués dans la régulation post-transcriptionnelle d’une importante famille de miARN et permettront de guider les futures études dans le domaine de recherche en pleine effervescence qu’est celui de la biogenèse des miARN.
Resumo:
Les dinoflagellés sont des eucaryotes unicellulaires que l’on retrouve autant en eau douce qu’en milieu marin. Ils sont particulièrement connus pour causer des fleurs d’algues toxiques nommées ‘marée-rouge’, ainsi que pour leur symbiose avec les coraux et pour leur importante contribution à la fixation du carbone dans les océans. Au point de vue moléculaire, ils sont aussi connus pour leur caractéristiques nucléaires uniques, car on retrouve généralement une quantité immense d’ADN dans leurs chromosomes et ceux-ci sont empaquetés et condensés sous une forme cristalline liquide au lieu de nucléosomes. Les gènes encodés par le noyau sont souvent présents en multiples copies et arrangés en tandem et aucun élément de régulation transcriptionnelle, y compris la boite TATA, n’a encore été observé. L’organisation unique de la chromatine des dinoflagellés suggère que différentes stratégies sont nécessaires pour contrôler l’expression des gènes de ces organismes. Dans cette étude, j’ai abordé ce problème en utilisant le dinoflagellé photosynthétique Lingulodinium polyedrum comme modèle. L. polyedrum est d’un intérêt particulier, car il a plusieurs rythmes circadiens (journalier). À ce jour, toutes les études sur l’expression des gènes lors des changements circadiens ont démontrées une régulation à un niveau traductionnel. Pour mes recherches, j’ai utilisé les approches transcriptomique, protéomique et phosphoprotéomique ainsi que des études biochimiques pour donner un aperçu de la mécanique de la régulation des gènes des dinoflagellés, ceci en mettant l’accent sur l’importance de la phosphorylation du système circadien de L. polyedrum. L’absence des protéines histones et des nucléosomes est une particularité des dinoflagellés. En utilisant la technologie RNA-Seq, j’ai trouvé des séquences complètes encodant des histones et des enzymes modifiant les histones. L polyedrum exprime donc des séquences conservées codantes pour les histones, mais le niveau d’expression protéique est plus faible que les limites de détection par immunodétection de type Western. Les données de séquençage RNA-Seq ont également été utilisées pour générer un transcriptome, qui est une liste des gènes exprimés par L. polyedrum. Une recherche par homologie de séquences a d’abord été effectuée pour classifier les transcrits en diverses catégories (Gene Ontology; GO). Cette analyse a révélé une faible abondance des facteurs de transcription et une surprenante prédominance, parmi ceux-ci, des séquences à domaine Cold Shock. Chez L. polyedrum, plusieurs gènes sont répétés en tandem. Un alignement des séquences obtenues par RNA-Seq avec les copies génomiques de gènes organisés en tandem a été réalisé pour examiner la présence de transcrits polycistroniques, une hypothèse formulée pour expliquer le manque d’élément promoteur dans la région intergénique de la séquence de ces gènes. Cette analyse a également démontré une très haute conservation des séquences codantes des gènes organisés en tandem. Le transcriptome a également été utilisé pour aider à l’identification de protéines après leur séquençage par spectrométrie de masse, et une fraction enrichie en phosphoprotéines a été déterminée comme particulièrement bien adapté aux approches d’analyse à haut débit. La comparaison des phosphoprotéomes provenant de deux périodes différentes de la journée a révélée qu’une grande partie des protéines pour lesquelles l’état de phosphorylation varie avec le temps est reliées aux catégories de liaison à l’ARN et de la traduction. Le transcriptome a aussi été utilisé pour définir le spectre des kinases présentes chez L. polyedrum, qui a ensuite été utilisé pour classifier les différents peptides phosphorylés qui sont potentiellement les cibles de ces kinases. Plusieurs peptides identifiés comme étant phosphorylés par la Casein Kinase 2 (CK2), une kinase connue pour être impliquée dans l’horloge circadienne des eucaryotes, proviennent de diverses protéines de liaison à l’ARN. Pour évaluer la possibilité que quelques-unes des multiples protéines à domaine Cold Shock identifiées dans le transcriptome puissent moduler l’expression des gènes de L. polyedrum, tel qu’observé chez plusieurs autres systèmes procaryotiques et eucaryotiques, la réponse des cellules à des températures froides a été examinée. Les températures froides ont permis d’induire rapidement un enkystement, condition dans laquelle ces cellules deviennent métaboliquement inactives afin de résister aux conditions environnementales défavorables. Les changements dans le profil des phosphoprotéines seraient le facteur majeur causant la formation de kystes. Les phosphosites prédits pour être phosphorylés par la CK2 sont la classe la plus fortement réduite dans les kystes, une découverte intéressante, car le rythme de la bioluminescence confirme que l’horloge a été arrêtée dans le kyste.
Resumo:
Le centromère est la région chromosomique où le kinétochore s'assemble en mitose. Contrairement à certaines caractéristiques géniques, la séquence centromérique n'est ni conservée entre les espèces ni suffisante à la fonction centromérique. Il est donc bien accepté dans la littérature que le centromère est régulé épigénétiquement par une variante de l'histone H3, CENP-A. KNL-2, aussi connu sous le nom de M18BP1, ainsi que ces partenaires Mis18α et Mis18β sont des protéines essentielles pour l'incorporation de CENP-A nouvellement synthétisé aux centromères. Des évidences expérimentales démontrent que KNL-2, ayant un domaine de liaison à l'ADN nommé Myb, est la protéine la plus en amont pour l'incorporation de CENP-A aux centromères en phase G1. Par contre, sa fonction dans le processus d'incorporation de CENP-A aux centromères n'est pas bien comprise et ces partenaires de liaison ne sont pas tous connus. De nouveaux partenaires de liaison de KNL-2 ont été identifiés par des expériences d'immunoprécipitation suivies d'une analyse en spectrométrie de masse. Un rôle dans l'incorporation de CENP-A nouvellement synthétisé aux centromères a été attribué à MgcRacGAP, une des 60 protéines identifiées par l'essai. MgcRacGAP ainsi que les protéines ECT-2 (GEF) et la petite GTPase Cdc42 ont été démontrées comme étant requises pour la stabilité de CENP-A incorporé aux centromères. Ces différentes observations ont mené à l'identification d'une troisième étape au niveau moléculaire pour l'incorporation de CENP-A nouvellement synthétisé en phase G1, celle de la stabilité de CENP-A nouvellement incorporé aux centromères. Cette étape est importante pour le maintien de l'identité centromérique à chaque division cellulaire. Pour caractériser la fonction de KNL-2 lors de l'incorporation de CENP-A nouvellement synthétisé aux centromères, une technique de microscopie à haute résolution couplée à une quantification d'image a été utilisée. Les résultats générés démontrent que le recrutement de KNL-2 au centromère est rapide, environ 5 minutes après la sortie de la mitose. De plus, la structure du domaine Myb de KNL-2 provenant du nématode C. elegans a été résolue par RMN et celle-ci démontre un motif hélice-tour-hélice, une structure connue pour les domaines de liaison à l'ADN de la famille Myb. De plus, les domaines humain (HsMyb) et C. elegans (CeMyb) Myb lient l'ADN in vitro, mais aucune séquence n'est reconnue spécifiquement par ces domaines. Cependant, il a été possible de démontrer que ces deux domaines lient préférentiellement la chromatine CENP-A-YFP comparativement à la chromatine H2B-GFP par un essai modifié de SIMPull sous le microscope TIRF. Donc, le domaine Myb de KNL-2 est suffisant pour reconnaître de façon spécifique la chromatine centromérique. Finalement, l'élément reconnu par les domaines Myb in vitro a potentiellement été identifié. En effet, il a été démontré que les domaines HsMyb et CeMyb lient l'ADN simple brin in vitro. De plus, les domaines HsMyb et CeMyb ne colocalisent pas avec CENP-A lorsqu'exprimés dans les cellules HeLa, mais plutôt avec les corps nucléaires PML, des structures nucléaires composées d'ARN. Donc, en liant potentiellement les transcrits centromériques, les domaines Myb de KNL-2 pourraient spécifier l'incorporation de CENP-A nouvellement synthétisé uniquement aux régions centromériques.
Resumo:
Les ARN non codants (ARNnc) sont des transcrits d'ARN qui ne sont pas traduits en protéines et qui pourtant ont des fonctions clés et variées dans la cellule telles que la régulation des gènes, la transcription et la traduction. Parmi les nombreuses catégories d'ARNnc qui ont été découvertes, on trouve des ARN bien connus tels que les ARN ribosomiques (ARNr), les ARN de transfert (ARNt), les snoARN et les microARN (miARN). Les fonctions des ARNnc sont étroitement liées à leurs structures d’où l’importance de développer des outils de prédiction de structure et des méthodes de recherche de nouveaux ARNnc. Les progrès technologiques ont mis à la disposition des chercheurs des informations abondantes sur les séquences d'ARN. Ces informations sont accessibles dans des bases de données telles que Rfam, qui fournit des alignements et des informations structurelles sur de nombreuses familles d'ARNnc. Dans ce travail, nous avons récupéré toutes les séquences des structures secondaires annotées dans Rfam, telles que les boucles en épingle à cheveux, les boucles internes, les renflements « bulge », etc. dans toutes les familles d'ARNnc. Une base de données locale, RNAstem, a été créée pour faciliter la manipulation et la compilation des données sur les motifs de structure secondaire. Nous avons analysé toutes les boucles terminales et internes ainsi que les « bulges » et nous avons calculé un score d’abondance qui nous a permis d’étudier la fréquence de ces motifs. Tout en minimisant le biais de la surreprésentation de certaines classes d’ARN telles que l’ARN ribosomal, l’analyse des scores a permis de caractériser les motifs rares pour chacune des catégories d’ARN en plus de confirmer des motifs communs comme les boucles de type GNRA ou UNCG. Nous avons identifié des motifs abondants qui n’ont pas été étudiés auparavant tels que la « tetraloop » UUUU. En analysant le contenu de ces motifs en nucléotides, nous avons remarqué que ces régions simples brins contiennent beaucoup plus de nucléotides A et U. Enfin, nous avons exploré la possibilité d’utiliser ces scores pour la conception d’un filtre qui permettrait d’accélérer la recherche de nouveaux ARN non-codants. Nous avons développé un système de scores, RNAscore, qui permet d’évaluer un ARN en se basant sur son contenu en motifs et nous avons testé son applicabilité avec différents types de contrôles.