29 resultados para RNAseq
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
2016
Resumo:
Dissertação de mestrado em Plant Molecular Biology, Biotechnology and Bioentrepreneurship
Resumo:
2 Abstract2.1 En françaisLe séquençage du génome humain est un pré-requis fondamental à la compréhension de la biologie de l'être humain. Ce projet achevé, les scientifiques ont dû faire face à une tâche aussi importante, comprendre cette suite de 3 milliards de lettres qui compose notre génome. Le consortium ENCODE (ENCyclopedia Of Dna Elements) fût formé comme une suite logique au projet du génome humain. Son rôle est d'identifier tous les éléments fonctionnels de notre génome incluant les régions transcrites, les sites d'attachement des facteurs de transcription, les sites hypersensibles à la DNAse I ainsi que les marqueurs de modification des histones. Dans le cadre de ma thèse doctorale, j'ai participé à 2 sous-projets d'ENCODE. En premier lieu, j'ai eu la tâche de développer et d'optimiser une technique de validation expérimentale à haut rendement de modèles de gènes qui m'a permis d'estimer la qualité de la plus récente annotation manuelle. Ce nouveau processus de validation est bien plus efficace que la technique RNAseq qui est actuellement en train de devenir la norme. Cette technique basée sur la RT-PCR, m'a notamment permis de découvrir de nouveaux exons dans 10% des régions interrogées. En second lieu j'ai participé à une étude ayant pour but d'identifier les extrémités de tous les gènes des chromosomes humains 21 et 22. Cette étude à permis l'identification à large échelle de transcrits chimères comportant des séquences provenant de deux gènes distincts pouvant être à une grande distance l'un de autre.2.2 In EnglishThe completion of the human genome sequence js the prerequisite to fully understand the biology of human beings. This project achieved, scientists had to face another challenging task, understanding the meaning of the 3 billion letters composing this genome. As a logical continuation of the human genome project, the ENCODE (ENCyclopedia Of DNA Elements) consortium was formed with the aim of annotating all its functional elements. These elements include transcribed regions, transcription binding sites, DNAse I hypersensitive sites and histone modification marks. In the frame of my PhD thesis, I was involved in two sub-projects of ENCODE. Firstly I developed and optimized an high throughput method to validate gene models, which allowed me to assess the quality of the most recent manually-curated annotation. This novel experimental validation pipeline is extremely effective, far more so than transcriptome profiling through RNA sequencing, which is becoming the norm. This RT-PCR-seq targeted-approach is likewise particularly efficient in identifying novel exons, as we discovered about 10% of loci with unannotated exons. Secondly, I participated to a study aiming to identify the gene boundaries of all genes in the human chromosome 21 and 22. This study led to the identification of chimeric transcripts that are composed of sequences coming form two distinct genes that can be map far away from each other.
Resumo:
Fully differentiated pancreatic β cells are essential for normal glucose homeostasis in mammals. Dedifferentiation of these cells has been suggested to occur in type 2 diabetes, impairing insulin production. Since chronic fuel excess ("glucotoxicity") is implicated in this process, we sought here to identify the potential roles in β-cell identity of the tumor suppressor liver kinase B1 (LKB1/STK11) and the downstream fuel-sensitive kinase, AMP-activated protein kinase (AMPK). Highly β-cell-restricted deletion of each kinase in mice, using an Ins1-controlled Cre, was therefore followed by physiological, morphometric, and massive parallel sequencing analysis. Loss of LKB1 strikingly (2.0-12-fold, E<0.01) increased the expression of subsets of hepatic (Alb, Iyd, Elovl2) and neuronal (Nptx2, Dlgap2, Cartpt, Pdyn) genes, enhancing glutamate signaling. These changes were partially recapitulated by the loss of AMPK, which also up-regulated β-cell "disallowed" genes (Slc16a1, Ldha, Mgst1, Pdgfra) 1.8- to 3.4-fold (E<0.01). Correspondingly, targeted promoters were enriched for neuronal (Zfp206; P=1.3×10(-33)) and hypoxia-regulated (HIF1; P=2.5×10(-16)) transcription factors. In summary, LKB1 and AMPK, through only partly overlapping mechanisms, maintain β-cell identity by suppressing alternate pathways leading to neuronal, hepatic, and other characteristics. Selective targeting of these enzymes may provide a new approach to maintaining β-cell function in some forms of diabetes.-Kone, M., Pullen, T. J., Sun, G., Ibberson, M., Martinez-Sanchez, A., Sayers, S., Nguyen-Tu, M.-S., Kantor, C., Swisa, A., Dor, Y., Gorman, T., Ferrer, J., Thorens, B., Reimann, F., Gribble, F., McGinty, J. A., Chen, L., French, P. M., Birzele, F., Hildebrandt, T., Uphues, I., Rutter, G. A. LKB1 and AMPK differentially regulate pancreatic β-cell identity.
Resumo:
Alternative splicing (AS) has the potential to greatly expand the functional repertoire of mammalian transcriptomes. However, few variant transcripts have been characterized functionally, making it difficult to assess the contribution of AS to the generation of phenotypic complexity and to study the evolution of splicing patterns. We have compared the AS of 309 protein-coding genes in the human ENCODE pilot regions against their mouse orthologs in unprecedented detail, utilizing traditional transcriptomic and RNAseq data. The conservation status of every transcript has been investigated, and each functionally categorized as coding (separated into coding sequence [CDS] or nonsense-mediated decay [NMD] linked) or noncoding. In total, 36.7% of human and 19.3% of mouse coding transcripts are species specific, and we observe a 3.6 times excess of human NMD transcripts compared with mouse; in contrast to previous studies, the majority of species-specific AS is unlinked to transposable elements. We observe one conserved CDS variant and one conserved NMD variant per 2.3 and 11.4 genes, respectively. Subsequently, we identify and characterize equivalent AS patterns for 22.9% of these CDS or NMD-linked events in nonmammalian vertebrate genomes, and our data indicate that functional NMD-linked AS is more widespread and ancient than previously thought. Furthermore, although we observe an association between conserved AS and elevated sequence conservation, as previously reported, we emphasize that 30% of conserved AS exons display sequence conservation below the average score for constitutive exons. In conclusion, we demonstrate the value of detailed comparative annotation in generating a comprehensive set of AS transcripts, increasing our understanding of AS evolution in vertebrates. Our data supports a model whereby the acquisition of functional AS has occurred throughout vertebrate evolution and is considered alongside amino acid change as a key mechanism in gene evolution.
Resumo:
Les dinoflagellés sont des eucaryotes unicellulaires que l’on retrouve autant en eau douce qu’en milieu marin. Ils sont particulièrement connus pour causer des fleurs d’algues toxiques nommées ‘marée-rouge’, ainsi que pour leur symbiose avec les coraux et pour leur importante contribution à la fixation du carbone dans les océans. Au point de vue moléculaire, ils sont aussi connus pour leur caractéristiques nucléaires uniques, car on retrouve généralement une quantité immense d’ADN dans leurs chromosomes et ceux-ci sont empaquetés et condensés sous une forme cristalline liquide au lieu de nucléosomes. Les gènes encodés par le noyau sont souvent présents en multiples copies et arrangés en tandem et aucun élément de régulation transcriptionnelle, y compris la boite TATA, n’a encore été observé. L’organisation unique de la chromatine des dinoflagellés suggère que différentes stratégies sont nécessaires pour contrôler l’expression des gènes de ces organismes. Dans cette étude, j’ai abordé ce problème en utilisant le dinoflagellé photosynthétique Lingulodinium polyedrum comme modèle. L. polyedrum est d’un intérêt particulier, car il a plusieurs rythmes circadiens (journalier). À ce jour, toutes les études sur l’expression des gènes lors des changements circadiens ont démontrées une régulation à un niveau traductionnel. Pour mes recherches, j’ai utilisé les approches transcriptomique, protéomique et phosphoprotéomique ainsi que des études biochimiques pour donner un aperçu de la mécanique de la régulation des gènes des dinoflagellés, ceci en mettant l’accent sur l’importance de la phosphorylation du système circadien de L. polyedrum. L’absence des protéines histones et des nucléosomes est une particularité des dinoflagellés. En utilisant la technologie RNA-Seq, j’ai trouvé des séquences complètes encodant des histones et des enzymes modifiant les histones. L polyedrum exprime donc des séquences conservées codantes pour les histones, mais le niveau d’expression protéique est plus faible que les limites de détection par immunodétection de type Western. Les données de séquençage RNA-Seq ont également été utilisées pour générer un transcriptome, qui est une liste des gènes exprimés par L. polyedrum. Une recherche par homologie de séquences a d’abord été effectuée pour classifier les transcrits en diverses catégories (Gene Ontology; GO). Cette analyse a révélé une faible abondance des facteurs de transcription et une surprenante prédominance, parmi ceux-ci, des séquences à domaine Cold Shock. Chez L. polyedrum, plusieurs gènes sont répétés en tandem. Un alignement des séquences obtenues par RNA-Seq avec les copies génomiques de gènes organisés en tandem a été réalisé pour examiner la présence de transcrits polycistroniques, une hypothèse formulée pour expliquer le manque d’élément promoteur dans la région intergénique de la séquence de ces gènes. Cette analyse a également démontré une très haute conservation des séquences codantes des gènes organisés en tandem. Le transcriptome a également été utilisé pour aider à l’identification de protéines après leur séquençage par spectrométrie de masse, et une fraction enrichie en phosphoprotéines a été déterminée comme particulièrement bien adapté aux approches d’analyse à haut débit. La comparaison des phosphoprotéomes provenant de deux périodes différentes de la journée a révélée qu’une grande partie des protéines pour lesquelles l’état de phosphorylation varie avec le temps est reliées aux catégories de liaison à l’ARN et de la traduction. Le transcriptome a aussi été utilisé pour définir le spectre des kinases présentes chez L. polyedrum, qui a ensuite été utilisé pour classifier les différents peptides phosphorylés qui sont potentiellement les cibles de ces kinases. Plusieurs peptides identifiés comme étant phosphorylés par la Casein Kinase 2 (CK2), une kinase connue pour être impliquée dans l’horloge circadienne des eucaryotes, proviennent de diverses protéines de liaison à l’ARN. Pour évaluer la possibilité que quelques-unes des multiples protéines à domaine Cold Shock identifiées dans le transcriptome puissent moduler l’expression des gènes de L. polyedrum, tel qu’observé chez plusieurs autres systèmes procaryotiques et eucaryotiques, la réponse des cellules à des températures froides a été examinée. Les températures froides ont permis d’induire rapidement un enkystement, condition dans laquelle ces cellules deviennent métaboliquement inactives afin de résister aux conditions environnementales défavorables. Les changements dans le profil des phosphoprotéines seraient le facteur majeur causant la formation de kystes. Les phosphosites prédits pour être phosphorylés par la CK2 sont la classe la plus fortement réduite dans les kystes, une découverte intéressante, car le rythme de la bioluminescence confirme que l’horloge a été arrêtée dans le kyste.
Resumo:
Chez les humains, un large pourcentage de leucémies myéloïdes et lymphoïdes exprime des gènes Homéobox (Hox) de façon aberrante, principalement ceux du groupe des gènes Hoxa. Cette dérégulation de l’expression des gènes Hox peut provenir directement des translocations impliquant des gènes Hox ou indirectement par d’autres protéines ayant un potentiel oncogénique. De plus, plusieurs études indiquent que les gènes Hox jouent un rôle essentiel dans l'initiation de diverses leucémies. Comprendre le fonctionnement des gènes Hox dans l'hématopoïèse normale est donc une condition préalable pour élucider leurs fonctions dans les leucémies, ce qui pourrait éventuellement conduire à l’élaboration de nouveaux traitements contre cette maladie. Plusieurs études ont tenté d’élucider les rôles exacts des gènes Hox dans l'hématopoïèse via l’utilisation de souris mutantes pour un seul gène Hox. Or, en raison du phénomène de redondance fonctionnelle chez cette famille de gènes, ces études ont été peu concluantes. Il a été précédemment démontré que dans une population de cellules enrichies en cellules souches hématopoïétiques (CSH), les gènes du cluster Hoxa sont plus exprimés que les gènes Hox des autres clusters. Aussi, il a été établi que les gènes du cluster Hoxb sont non essentiels à l’hématopoïèse définitive puisque les CSH mutantes pour les gènes Hoxb1-9 conservent leur potentiel de reconstitution à long terme. En nous basant sur ces données, nous avons émis l'hypothèse suivante : les gènes Hoxa sont essentiels pour l'hématopoïèse normale adulte. Pour tester notre hypothèse, nous avons choisi d’utiliser un modèle de souris comportant une délétion pour l’ensemble des gènes Hoxa. Dans le cadre de cette recherche, nous avons démontré que les CSH, les progéniteurs primitifs et les progéniteurs des cellules B sont particulièrement sensibles au niveau d'expression des gènes Hoxa. Plus particulièrement, une baisse de la survie et une différenciation prématurée semblent être à l’origine de la perte des CSH Hoxa-/- dans la moelle osseuse. L’analyse du profil transcriptionnel des CSH par séquençage de l'ARN a révélé que les gènes Hoxa sont capables de réguler un vaste réseau de gènes impliqués dans divers processus biologiques. En effet, les gènes Hoxa régulent l’expression de plusieurs gènes codant pour des récepteurs de cytokine. De plus, les gènes Hoxa influencent l’expression de gènes jouant une fonction dans l’architecture de la niche hématopoïétique. L’expression de plusieurs molécules d’adhésion est aussi modulée par les gènes Hoxa, ce qui peut affecter la relation des CSH avec la niche hématopoïétique. L’ensemble de ces résultats démontre que les gènes Hoxa sont d'importants régulateurs de l'hématopoïèse adulte puisqu’ils sont nécessaires au maintien des CSH et des progéniteurs grâce à leurs effets sur plusieurs processus biologiques comme l'apoptose, le cycle cellulaire et les interactions avec la niche.
Resumo:
Pós-graduação em Agronomia (Genética e Melhoramento de Plantas) - FCAV
Resumo:
Pós-graduação em Ciências Biológicas (Genética) - IBB
Resumo:
Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)
Resumo:
Neisseria meningitidis, the leading cause of bacterial meningitis, can adapt to different host niches during human infection. Both transcriptional and post-transcriptional regulatory networks have been identified as playing a crucial role for bacterial stress responses and virulence. We investigated the N. meningitidis transcriptional landscape both by microarray and by RNA sequencing (RNAseq). Microarray analysis of N. meningitidis grown in the presence or absence of glucose allowed us to identify genes regulated by carbon source availability. In particular, we identified a glucose-responsive hexR-like transcriptional regulator in N. meningitidis. Deletion analysis showed that the hexR gene is accountable for a subset of the glucose-responsive regulation, and in vitro assays with the purified protein showed that HexR binds to the promoters of the central metabolic operons of meningococcus, by targeting a DNA region overlapping putative regulatory sequences. Our results indicate that HexR coordinates the central metabolism of meningococcus in response to the availability of glucose, and N. meningitidis strains lacking the hexR gene are also deficient in establishing successful bacteremia in a mouse model of infection. In parallel, RNAseq analysis of N. meningitidis cultured under standard or iron-limiting in vitro growth conditions allowed us to identify novel small non-coding RNAs (sRNAs) potentially involved in N. meningitidis regulatory networks. Manual curation of the RNAseq data generated a list of 51 sRNAs, 8 of which were validated by Northern blotting. Deletion of selected sRNAs caused attenuation of N. meningitidis infection in a murine model, leading to the identification of the first sRNAs influencing meningococcal bacteraemia. Furthermore, we describe the identification and initial characterization of a novel sRNA unique to meningococcus, closely associated to genes relevant for the intracellular survival of pathogenic Neisseriae. Taken together, our findings could help unravel the regulation of N. meningitidis adaptation to the host environment and its implications for pathogenesis.
Resumo:
Background: Tef (Eragrostis tef), an indigenous cereal critical to food security in the Horn of Africa, is rich in minerals and protein, resistant to many biotic and abiotic stresses and safe for diabetics as well as sufferers of immune reactions to wheat gluten. We present the genome of tef, the first species in the grass subfamily Chloridoideae and the first allotetraploid assembled de novo. We sequenced the tef genome for marker-assisted breeding, to shed light on the molecular mechanisms conferring tef's desirable nutritional and agronomic properties, and to make its genome publicly available as a community resource. Results: The draft genome contains 672 Mbp representing 87% of the genome size estimated from flow cytometry. We also sequenced two transcriptomes, one from a normalized RNA library and another from unnormalized RNASeq data. The normalized RNA library revealed around 38000 transcripts that were then annotated by the SwissProt group. The CoGe comparative genomics platform was used to compare the tef genome to other genomes, notably sorghum. Scaffolds comprising approximately half of the genome size were ordered by syntenic alignment to sorghum producing tef pseudo-chromosomes, which were sorted into A and B genomes as well as compared to the genetic map of tef. The draft genome was used to identify novel SSR markers, investigate target genes for abiotic stress resistance studies, and understand the evolution of the prolamin family of proteins that are responsible for the immune response to gluten. Conclusions: It is highly plausible that breeding targets previously identified in other cereal crops will also be valuable breeding targets in tef. The draft genome and transcriptome will be of great use for identifying these targets for genetic improvement of this orphan crop that is vital for feeding 50 million people in the Horn of Africa.
Resumo:
It is well accepted that tumorigenesis is a multi-step procedure involving aberrant functioning of genes regulating cell proliferation, differentiation, apoptosis, genome stability, angiogenesis and motility. To obtain a full understanding of tumorigenesis, it is necessary to collect information on all aspects of cell activity. Recent advances in high throughput technologies allow biologists to generate massive amounts of data, more than might have been imagined decades ago. These advances have made it possible to launch comprehensive projects such as (TCGA) and (ICGC) which systematically characterize the molecular fingerprints of cancer cells using gene expression, methylation, copy number, microRNA and SNP microarrays as well as next generation sequencing assays interrogating somatic mutation, insertion, deletion, translocation and structural rearrangements. Given the massive amount of data, a major challenge is to integrate information from multiple sources and formulate testable hypotheses. This thesis focuses on developing methodologies for integrative analyses of genomic assays profiled on the same set of samples. We have developed several novel methods for integrative biomarker identification and cancer classification. We introduce a regression-based approach to identify biomarkers predictive to therapy response or survival by integrating multiple assays including gene expression, methylation and copy number data through penalized regression. To identify key cancer-specific genes accounting for multiple mechanisms of regulation, we have developed the integIRTy software that provides robust and reliable inferences about gene alteration by automatically adjusting for sample heterogeneity as well as technical artifacts using Item Response Theory. To cope with the increasing need for accurate cancer diagnosis and individualized therapy, we have developed a robust and powerful algorithm called SIBER to systematically identify bimodally expressed genes using next generation RNAseq data. We have shown that prediction models built from these bimodal genes have the same accuracy as models built from all genes. Further, prediction models with dichotomized gene expression measurements based on their bimodal shapes still perform well. The effectiveness of outcome prediction using discretized signals paves the road for more accurate and interpretable cancer classification by integrating signals from multiple sources.
Resumo:
The impact of ocean acidification (OA) on coral calcification, a subject of intense current interest, is poorly understood in part because of the presence of symbionts in adult corals. Early life history stages of Acropora spp. provide an opportunity to study the effects of elevated CO(2) on coral calcification without the complication of symbiont metabolism. Therefore, we used the Illumina RNAseq approach to study the effects of acute exposure to elevated CO(2) on gene expression in primary polyps of Acropora millepora, using as reference a novel comprehensive transcriptome assembly developed for this study. Gene ontology analysis of this whole transcriptome data set indicated that CO(2) -driven acidification strongly suppressed metabolism but enhanced extracellular organic matrix synthesis, whereas targeted analyses revealed complex effects on genes implicated in calcification. Unexpectedly, expression of most ion transport proteins was unaffected, while many membrane-associated or secreted carbonic anhydrases were expressed at lower levels. The most dramatic effect of CO(2) -driven acidification, however, was on genes encoding candidate and known components of the skeletal organic matrix that controls CaCO(3) deposition. The skeletal organic matrix effects included elevated expression of adult-type galaxins and some secreted acidic proteins, but down-regulation of other galaxins, secreted acidic proteins, SCRiPs and other coral-specific genes, suggesting specialized roles for the members of these protein families and complex impacts of OA on mineral deposition. This study is the first exhaustive exploration of the transcriptomic response of a scleractinian coral to acidification and provides an unbiased perspective on its effects during the early stages of calcification.