Regulation of gene expression in the dinoflagellate Lingulodinium polyedrum


Autoria(s): Roy, Sougata
Contribuinte(s)

Morse, David

Data(s)

21/05/2014

31/12/1969

21/05/2014

01/05/2014

01/07/2013

Resumo

Les dinoflagellés sont des eucaryotes unicellulaires que l’on retrouve autant en eau douce qu’en milieu marin. Ils sont particulièrement connus pour causer des fleurs d’algues toxiques nommées ‘marée-rouge’, ainsi que pour leur symbiose avec les coraux et pour leur importante contribution à la fixation du carbone dans les océans. Au point de vue moléculaire, ils sont aussi connus pour leur caractéristiques nucléaires uniques, car on retrouve généralement une quantité immense d’ADN dans leurs chromosomes et ceux-ci sont empaquetés et condensés sous une forme cristalline liquide au lieu de nucléosomes. Les gènes encodés par le noyau sont souvent présents en multiples copies et arrangés en tandem et aucun élément de régulation transcriptionnelle, y compris la boite TATA, n’a encore été observé. L’organisation unique de la chromatine des dinoflagellés suggère que différentes stratégies sont nécessaires pour contrôler l’expression des gènes de ces organismes. Dans cette étude, j’ai abordé ce problème en utilisant le dinoflagellé photosynthétique Lingulodinium polyedrum comme modèle. L. polyedrum est d’un intérêt particulier, car il a plusieurs rythmes circadiens (journalier). À ce jour, toutes les études sur l’expression des gènes lors des changements circadiens ont démontrées une régulation à un niveau traductionnel. Pour mes recherches, j’ai utilisé les approches transcriptomique, protéomique et phosphoprotéomique ainsi que des études biochimiques pour donner un aperçu de la mécanique de la régulation des gènes des dinoflagellés, ceci en mettant l’accent sur l’importance de la phosphorylation du système circadien de L. polyedrum. L’absence des protéines histones et des nucléosomes est une particularité des dinoflagellés. En utilisant la technologie RNA-Seq, j’ai trouvé des séquences complètes encodant des histones et des enzymes modifiant les histones. L polyedrum exprime donc des séquences conservées codantes pour les histones, mais le niveau d’expression protéique est plus faible que les limites de détection par immunodétection de type Western. Les données de séquençage RNA-Seq ont également été utilisées pour générer un transcriptome, qui est une liste des gènes exprimés par L. polyedrum. Une recherche par homologie de séquences a d’abord été effectuée pour classifier les transcrits en diverses catégories (Gene Ontology; GO). Cette analyse a révélé une faible abondance des facteurs de transcription et une surprenante prédominance, parmi ceux-ci, des séquences à domaine Cold Shock. Chez L. polyedrum, plusieurs gènes sont répétés en tandem. Un alignement des séquences obtenues par RNA-Seq avec les copies génomiques de gènes organisés en tandem a été réalisé pour examiner la présence de transcrits polycistroniques, une hypothèse formulée pour expliquer le manque d’élément promoteur dans la région intergénique de la séquence de ces gènes. Cette analyse a également démontré une très haute conservation des séquences codantes des gènes organisés en tandem. Le transcriptome a également été utilisé pour aider à l’identification de protéines après leur séquençage par spectrométrie de masse, et une fraction enrichie en phosphoprotéines a été déterminée comme particulièrement bien adapté aux approches d’analyse à haut débit. La comparaison des phosphoprotéomes provenant de deux périodes différentes de la journée a révélée qu’une grande partie des protéines pour lesquelles l’état de phosphorylation varie avec le temps est reliées aux catégories de liaison à l’ARN et de la traduction. Le transcriptome a aussi été utilisé pour définir le spectre des kinases présentes chez L. polyedrum, qui a ensuite été utilisé pour classifier les différents peptides phosphorylés qui sont potentiellement les cibles de ces kinases. Plusieurs peptides identifiés comme étant phosphorylés par la Casein Kinase 2 (CK2), une kinase connue pour être impliquée dans l’horloge circadienne des eucaryotes, proviennent de diverses protéines de liaison à l’ARN. Pour évaluer la possibilité que quelques-unes des multiples protéines à domaine Cold Shock identifiées dans le transcriptome puissent moduler l’expression des gènes de L. polyedrum, tel qu’observé chez plusieurs autres systèmes procaryotiques et eucaryotiques, la réponse des cellules à des températures froides a été examinée. Les températures froides ont permis d’induire rapidement un enkystement, condition dans laquelle ces cellules deviennent métaboliquement inactives afin de résister aux conditions environnementales défavorables. Les changements dans le profil des phosphoprotéines seraient le facteur majeur causant la formation de kystes. Les phosphosites prédits pour être phosphorylés par la CK2 sont la classe la plus fortement réduite dans les kystes, une découverte intéressante, car le rythme de la bioluminescence confirme que l’horloge a été arrêtée dans le kyste.

Dinoflagellates are unicellular eukaryotes found in both marine and freshwater environments. They are best known for causing toxic blooms called ‘red-tides’, for their symbiosis with corals, and for their important contribution to carbon fixation in the ocean. On a more molecular level, they are also known for their unique nuclear characteristics, as they generally have huge amount of DNA found in chromosomes that are permanently condensed and packaged into liquid crystalline forms instead of nucleosomes. Nuclear-encoded genes are often present in multiple copies and arranged in tandem, and no putative promoter elements including the conserved TATA box, have yet been observed. The unique organization of dinoflagellate chromatin suggests different strategies may be required to regulate gene expression in these organisms. In this study, I have started to address this problem using the photosynthetic dinoflagellate Lingulodinium polyedrum as a model. L. polyedrum is of particular interest because it shows a number of circadian (daily) rhythms. To date, all circadian changes in gene expression studied are regulated at a translational level. I have used transcriptomic, proteomic and phosphoproteomic approaches along with biochemical studies to provide insight into the gene regulatory mechanisms in dinoflagellates, with particular emphasis on the importance of phosphorylation in the L. polyedrum circadian system. The absence of histone proteins and nucleosomes is a hallmark of the dinoflagellates. Using high throughput RNA-seq technology, I found complete set of sequences encoding the core histones as well as sequences encoding histone-modifying enzymes in L. polyedrum. Thus L. polyedrum expresses conserved histone transcripts, although levels of proteins are still below what can be detected using immunoblotting studies. Using the de novo assembly algorithm the RNA-seq data was used to generate a transcriptome. This transcriptome, a list of genes expressed by L. polyedrum, has been extensively characterized. First, homology based sequence searches were used to classify the transcripts in gene ontology (GO) categories, and this analysis revealed a reduced number of transcription factor types and a surprising predominance of sequences containing a cold shock domain. Alignments of reads from the RNA–seq to genomic copies of L. polyedrum tandem repeat sequences was performed to assess the possibility of polycistronic transcripts, a hypothesis proposed to explain the lack of promoter elements in the intergenic region of the tandem repeat gene sequences. This analysis also showed a surprisingly high conservation of tandemly repeated gene sequences. The transcriptome database was also used to fuel gene identification after protein sequencing by mass spectrometry, and a purified phosphoproteome fraction was found to be particularly amenable to high throughput approaches. A comparison of the phosphoproteome at two different times of day revealed that a major class of proteins whose phosphorylation state varied over time belonged to the RNA binding and translation GO category. The transcriptome was also used to define the spectrum of kinases present in L. polyedrum, which in turn was used to classify the different phosphorylated peptides as potential kinase targets. Predicted peptides of casein kinase 2 (CK2), a kinase known to be involved in the circadian clocks of other eukaryotes, were found to include many RNA binding proteins. To assess the possibility that some of the many cold shock domain proteins identified in the transcriptome might modulate gene expression in L. polyedrum, as has been observed in many other eukaryotic and prokaryotic systems, the cellular response to cold temperatures was examined. Cold temperatures were found to induce rapid encystment, a metabolically inactive cell type whose role is to combat unfavourable environmental conditions. Changes in phosphoproteome profile were found to be the major molecular correlates to cyst formation. Predicted CK2 phosphosites are the most highly reduced class of kinase targets, a finding of interest as measurements of the bioluminescence rhythm confirmed that the clock is stopped in cysts

Identificador

http://hdl.handle.net/1866/10516

Idioma(s)

en

Palavras-Chave #Dinoflagellé #Lingulodinium #Expression de gène #RNA-Seq #Transcriptome #Transcription #Traduction #Horloge Circadienne #Histones #Phosphoprotéomique #Dinoflagellate #Lingulodinium #Gene Expression #Translation #Circadian Clock #Histones #Phosphoproteomics #Biology - Molecular / Biologie - Biologie moléculaire (UMI : 0307)
Tipo

Thèse ou Mémoire numérique / Electronic Thesis or Dissertation