921 resultados para Rna Transcripts
Resumo:
Les interactions entre les squelettes sucre-phosphate de nucléotides jouent un rôle important dans la stabilisation des structures tertiaires de larges molécules d’ARN. Elles sont régies par des règles particulières qui gouverne leur formation mais qui jusque là demeure quasiment inconnues. Un élément structural d’ARN pour lequel les interactions sucre-phosphate sont importantes est le motif d’empaquetage de deux doubles hélices d’ARN le long du sillon mineur. Ce motif se trouve à divers endroits dans la structure du ribosome. Il consiste en deux doubles hélices interagissant de manière à ce que le squelette sucre-phosphate de l’une se niche dans le sillon mineur de l’autre et vice versa. La surface de contact entre les deux hélices est majoritairement formée par les riboses et implique au total douze nucléotides. La présente thèse a pour but d’analyser la structure interne de ce motif et sa dépendance de stabilité résultant de l’association optimale ou non des hélices, selon leurs séquences nucléotidiques. Il est démontré dans cette thèse qu’un positionnement approprié des riboses leur permet de former des contacts inter-hélices, par l’entremise d’un choix particulier de l’identité des pairs de bases impliquées. Pour différentes pairs de bases participant à ce contact inter-hélices, l’identité optimale peut être du type Watson-Crick, GC/CG, or certaines pairs de bases non Watson-Crick. Le choix adéquat de paires de bases fournit une interaction inter-hélice stable. Dans quelques cas du motif, l’identité de certaines paires de bases ne correspond pas à la structure la plus stable, ce qui pourrait refléter le fait que ces motifs devraient avoir une liberté de formation et de déformation lors du fonctionnement du ribosome.
Resumo:
Les dinoflagellés sont des eucaryotes unicellulaires que l’on retrouve autant en eau douce qu’en milieu marin. Ils sont particulièrement connus pour causer des fleurs d’algues toxiques nommées ‘marée-rouge’, ainsi que pour leur symbiose avec les coraux et pour leur importante contribution à la fixation du carbone dans les océans. Au point de vue moléculaire, ils sont aussi connus pour leur caractéristiques nucléaires uniques, car on retrouve généralement une quantité immense d’ADN dans leurs chromosomes et ceux-ci sont empaquetés et condensés sous une forme cristalline liquide au lieu de nucléosomes. Les gènes encodés par le noyau sont souvent présents en multiples copies et arrangés en tandem et aucun élément de régulation transcriptionnelle, y compris la boite TATA, n’a encore été observé. L’organisation unique de la chromatine des dinoflagellés suggère que différentes stratégies sont nécessaires pour contrôler l’expression des gènes de ces organismes. Dans cette étude, j’ai abordé ce problème en utilisant le dinoflagellé photosynthétique Lingulodinium polyedrum comme modèle. L. polyedrum est d’un intérêt particulier, car il a plusieurs rythmes circadiens (journalier). À ce jour, toutes les études sur l’expression des gènes lors des changements circadiens ont démontrées une régulation à un niveau traductionnel. Pour mes recherches, j’ai utilisé les approches transcriptomique, protéomique et phosphoprotéomique ainsi que des études biochimiques pour donner un aperçu de la mécanique de la régulation des gènes des dinoflagellés, ceci en mettant l’accent sur l’importance de la phosphorylation du système circadien de L. polyedrum. L’absence des protéines histones et des nucléosomes est une particularité des dinoflagellés. En utilisant la technologie RNA-Seq, j’ai trouvé des séquences complètes encodant des histones et des enzymes modifiant les histones. L polyedrum exprime donc des séquences conservées codantes pour les histones, mais le niveau d’expression protéique est plus faible que les limites de détection par immunodétection de type Western. Les données de séquençage RNA-Seq ont également été utilisées pour générer un transcriptome, qui est une liste des gènes exprimés par L. polyedrum. Une recherche par homologie de séquences a d’abord été effectuée pour classifier les transcrits en diverses catégories (Gene Ontology; GO). Cette analyse a révélé une faible abondance des facteurs de transcription et une surprenante prédominance, parmi ceux-ci, des séquences à domaine Cold Shock. Chez L. polyedrum, plusieurs gènes sont répétés en tandem. Un alignement des séquences obtenues par RNA-Seq avec les copies génomiques de gènes organisés en tandem a été réalisé pour examiner la présence de transcrits polycistroniques, une hypothèse formulée pour expliquer le manque d’élément promoteur dans la région intergénique de la séquence de ces gènes. Cette analyse a également démontré une très haute conservation des séquences codantes des gènes organisés en tandem. Le transcriptome a également été utilisé pour aider à l’identification de protéines après leur séquençage par spectrométrie de masse, et une fraction enrichie en phosphoprotéines a été déterminée comme particulièrement bien adapté aux approches d’analyse à haut débit. La comparaison des phosphoprotéomes provenant de deux périodes différentes de la journée a révélée qu’une grande partie des protéines pour lesquelles l’état de phosphorylation varie avec le temps est reliées aux catégories de liaison à l’ARN et de la traduction. Le transcriptome a aussi été utilisé pour définir le spectre des kinases présentes chez L. polyedrum, qui a ensuite été utilisé pour classifier les différents peptides phosphorylés qui sont potentiellement les cibles de ces kinases. Plusieurs peptides identifiés comme étant phosphorylés par la Casein Kinase 2 (CK2), une kinase connue pour être impliquée dans l’horloge circadienne des eucaryotes, proviennent de diverses protéines de liaison à l’ARN. Pour évaluer la possibilité que quelques-unes des multiples protéines à domaine Cold Shock identifiées dans le transcriptome puissent moduler l’expression des gènes de L. polyedrum, tel qu’observé chez plusieurs autres systèmes procaryotiques et eucaryotiques, la réponse des cellules à des températures froides a été examinée. Les températures froides ont permis d’induire rapidement un enkystement, condition dans laquelle ces cellules deviennent métaboliquement inactives afin de résister aux conditions environnementales défavorables. Les changements dans le profil des phosphoprotéines seraient le facteur majeur causant la formation de kystes. Les phosphosites prédits pour être phosphorylés par la CK2 sont la classe la plus fortement réduite dans les kystes, une découverte intéressante, car le rythme de la bioluminescence confirme que l’horloge a été arrêtée dans le kyste.
Resumo:
Le centromère est la région chromosomique où le kinétochore s'assemble en mitose. Contrairement à certaines caractéristiques géniques, la séquence centromérique n'est ni conservée entre les espèces ni suffisante à la fonction centromérique. Il est donc bien accepté dans la littérature que le centromère est régulé épigénétiquement par une variante de l'histone H3, CENP-A. KNL-2, aussi connu sous le nom de M18BP1, ainsi que ces partenaires Mis18α et Mis18β sont des protéines essentielles pour l'incorporation de CENP-A nouvellement synthétisé aux centromères. Des évidences expérimentales démontrent que KNL-2, ayant un domaine de liaison à l'ADN nommé Myb, est la protéine la plus en amont pour l'incorporation de CENP-A aux centromères en phase G1. Par contre, sa fonction dans le processus d'incorporation de CENP-A aux centromères n'est pas bien comprise et ces partenaires de liaison ne sont pas tous connus. De nouveaux partenaires de liaison de KNL-2 ont été identifiés par des expériences d'immunoprécipitation suivies d'une analyse en spectrométrie de masse. Un rôle dans l'incorporation de CENP-A nouvellement synthétisé aux centromères a été attribué à MgcRacGAP, une des 60 protéines identifiées par l'essai. MgcRacGAP ainsi que les protéines ECT-2 (GEF) et la petite GTPase Cdc42 ont été démontrées comme étant requises pour la stabilité de CENP-A incorporé aux centromères. Ces différentes observations ont mené à l'identification d'une troisième étape au niveau moléculaire pour l'incorporation de CENP-A nouvellement synthétisé en phase G1, celle de la stabilité de CENP-A nouvellement incorporé aux centromères. Cette étape est importante pour le maintien de l'identité centromérique à chaque division cellulaire. Pour caractériser la fonction de KNL-2 lors de l'incorporation de CENP-A nouvellement synthétisé aux centromères, une technique de microscopie à haute résolution couplée à une quantification d'image a été utilisée. Les résultats générés démontrent que le recrutement de KNL-2 au centromère est rapide, environ 5 minutes après la sortie de la mitose. De plus, la structure du domaine Myb de KNL-2 provenant du nématode C. elegans a été résolue par RMN et celle-ci démontre un motif hélice-tour-hélice, une structure connue pour les domaines de liaison à l'ADN de la famille Myb. De plus, les domaines humain (HsMyb) et C. elegans (CeMyb) Myb lient l'ADN in vitro, mais aucune séquence n'est reconnue spécifiquement par ces domaines. Cependant, il a été possible de démontrer que ces deux domaines lient préférentiellement la chromatine CENP-A-YFP comparativement à la chromatine H2B-GFP par un essai modifié de SIMPull sous le microscope TIRF. Donc, le domaine Myb de KNL-2 est suffisant pour reconnaître de façon spécifique la chromatine centromérique. Finalement, l'élément reconnu par les domaines Myb in vitro a potentiellement été identifié. En effet, il a été démontré que les domaines HsMyb et CeMyb lient l'ADN simple brin in vitro. De plus, les domaines HsMyb et CeMyb ne colocalisent pas avec CENP-A lorsqu'exprimés dans les cellules HeLa, mais plutôt avec les corps nucléaires PML, des structures nucléaires composées d'ARN. Donc, en liant potentiellement les transcrits centromériques, les domaines Myb de KNL-2 pourraient spécifier l'incorporation de CENP-A nouvellement synthétisé uniquement aux régions centromériques.
Resumo:
Le rôle des deux paires de bases universelles inverse Hoogsteen U : A ( RHUAs ) présentent chez les ARNt standards , une dans la boucle T et l'autre dans le noyau de la forme en L , a été étudiée. Pour chacun des RHUAs , un criblage génétique spécialisé in vivo chez les bactéries , le système suppresseur ambre ( pour l'étude de la RHUA dans la boucle T ) et le système d'ARNt de la sélénocystéine ( tRNASec ) ( pour l'étude de la RHUA dans le noyau ) , ont été utilisé pour générer des variants fonctionnels à partir de multiples librairies combinatoires . Ces variants ont ensuite été séquencé et soumis à une analyse systématique qui comprend la modélisation informatique et un type d'analyse phylogénétique. Les résultats du système suppresseur ambre ont montré un ensemble de variants fonctionnels qui ne nécessitent pas le motif RHUA dans la boucle T et qui ont remplacé la méthode standard de l'interaction entre les boucles D et T avec une double hélice interboucle , ILDH . D'autres études ont abouti à la détermination d'un modèle In silico de l'alternative à la norme standard de la boucle T, sous le nom de type III . Les résultats du système tRNASec ont révélé que pour cette ARNt exceptionnel, l'absence de RHUA ( dans le noyau ) assure une flexibilité accrue qui est spécifiquement nécessaire pour la fonction de tRNASec . Ainsi, les ARNt standards , à la différence de tRNASec , avec la présence universelle de RHUA dans le noyau , a été naturellement sélectionnée pour être rigide . Pris ensemble, la RHUA joue un rôle essentiel dans la stabilisation des interactions tertiaires.
Resumo:
Le virus de l’hépatite C (VHC) est un virus à ARN simple brin positif (ssARN) qui se replique dans le foie. Deux cents millions de personnes sont infectées par le virus dans le monde et environ 80% d’entre elles progresseront vers un stade chronique de l’infection. Les thérapies anti-virales actuelles comme l’interféron (IFN) ou la ribavirin sont de plus en plus utilisées mais ne sont efficaces que dans la moitié des individus traités et sont souvent accompagnées d’une toxicité ou d’effets secondaires indésirables. Le système immunitaire inné est essentiel au contrôle des infections virales. Les réponses immunitaires innées sont activées suite à la reconnaissance par les Pathogen Recognition Receptors (PRRs), de motifs macromoléculaires dérivés du virus appelés Pathogen-Associated Molecular Patterns (PAMPs). Bien que l'activation du système immunitaire par l'ARN ou les protéines du VHC ait été largement étudiée, très peu de choses sont actuellement connues concernant la détection du virus par le système immunitaire inné. Et même si l’on peut très rapidement déceler des réponses immunes in vivo après infection par le VHC, l’augmentation progressive et continue de la charge virale met en évidence une incapacité du système immunitaire à contrôler l’infection virale. Une meilleure compréhension des mécanismes d’activation du système immunitaire par le VHC semble, par conséquent, essentielle au développement de stratégies antivirales plus efficaces. Dans le présent travail nous montrons, dans un modèle de cellule primaire, que le génome ARN du VHC contient des séquences riches en GU capables de stimuler spécifiquement les récepteurs de type Toll (TLR) 7 et 8. Cette stimulation a pour conséquence la maturation des cellules dendritiques plasmacytoïdes (pDCs), le production d’interféron de type I (IFN) ainsi que l’induction de chémokines et cytokines inflammatoires par les différentes types de cellules présentatrices d’antigènes (APCs). Les cytokines produites après stimulation de monocytes ou de pDCs par ces séquences ssARN virales, inhibent la production du virus de façon dépendante de l’IFN. En revanche, les cytokines produites après stimulation de cellules dendritiques myéloïdes (mDCs) ou de macrophages par ces mêmes séquences n’ont pas d’effet inhibiteur sur la production virale car les séquences ssARN virales n’induisent pas la production d’IFN par ces cellules. Les cytokines produites après stimulation des TLR 7/8 ont également pour effet de diminuer, de façon indépendante de l’IFN, l’expression du récepteur au VHC (CD81) sur la lignée cellulaire Huh7.5, ce qui pourrait avoir pour conséquence de restreindre l’infection par le VHC. Quoiqu’il en soit, même si les récepteurs au VHC comme le CD81 sont largement exprimés à la surface de différentes sous populations lymphocytaires, les DCs et les monocytes ne répondent pas aux VHC, Nos résultats indiquent que seuls les macrophages sont capables de reconnaître le VHC et de produire des cytokines inflammatoires en réponse à ce dernier. La reconnaissance du VHC par les macrophages est liée à l’expression membranaire de DC-SIGN et l’engagement des TLR 7/8 qui en résulte. Comme d’autres agonistes du TLR 7/8, le VHC stimule la production de cytokines inflammatoires (TNF-α, IL-8, IL-6 et IL-1b) mais n’induit pas la production d’interféron-beta par les macrophages. De manière attendue, la production de cytokines par des macrophages stimulés par les ligands du TLR 7/8 ou les séquences ssARN virales n’inhibent pas la réplication virale. Nos résultats mettent en évidence la capacité des séquences ssARN dérivées du VHC à stimuler les TLR 7/8 dans différentes populations de DC et à initier une réponse immunitaire innée qui aboutit à la suppression de la réplication virale de façon dépendante de l’IFN. Quoiqu’il en soit, le VHC est capable d’échapper à sa reconnaissance par les monocytes et les DCs qui ont le potentiel pour produire de l’IFN et inhiber la réplication virale après engagement des TLR 7/8. Les macrophages possèdent quant à eux la capacité de reconnaître le VHC grâce en partie à l’expression de DC-SIGN à leur surface, mais n’inhibent pas la réplication du virus car ils ne produisent pas d’IFN. L’échappement du VHC aux défenses antivirales pourrait ainsi expliquer l’échec du système immunitaire inné à contrôler l’infection par le VHC. De plus, la production de cytokines inflammatoires observée après stimulation in vitro des macrophages par le VHC suggère leur potentielle contribution dans l’inflammation que l’on retrouve chez les individus infectés par le VHC.
Resumo:
La période de réceptivité endométriale chez l’humain coïncide avec la différentiation des cellules stromales de l’endomètre en cellules hautement spécifiques, les cellules déciduales, durant le processus dit de décidualisation. Or, on sait qu’une transformation anormale des cellules endométriales peut être à l’origine de pertes récurrentes de grossesses. LRH-1 est un récepteur nucléaire orphelin et un facteur de transcription régulant de nombreux évènements relatif à la reproduction et comme tout récepteur, son activation promouvoit l’activité transcriptionnelle de ses gènes cibles. Nous avons déjà montré que LRH-1 et son activité sont essentiels pour la décidualisation au niveau de l’utérus chez la souris et nous savons qu’il est présent dans l’utérus chez l’humain au moment de la phase de prolifération mais aussi de sécrétion du cycle menstruel, et que son expression augmente dans des conditions de décidualisation in vitro. Notre hypothèse est alors la suivante : LRH-1 est indispensable à la décidualisation du stroma endométrial, agissant par le biais de la régulation transcriptionnelle de gènes requis pour la transformation de cellules stromales en cellules déciduales. Afin d’explorer le mécanisme moléculaire impliqué dans la régulation transcriptionnelle effectuée par l’intermédiaire de ce récepteur, nous avons mis en place un modèle de décidualisation in vitro utilisant une lignée de cellules stromales de l’endomètre, cellules humaines et immortelles (hESC). Notre modèle de surexpression développé en transfectant les dites cellules avec un plasmide exprimant LRH-1, résulte en l’augmentation, d’un facteur 5, de l’abondance du transcriptome de gènes marqueurs de la décidualisation que sont la prolactine (PRL) et l’insulin-like growth factor binding protein-1 (IGFBP-1). En outre, la sous-régulation de ce récepteur par l’intermédiaire de petits ARN interférents (shRNA) abolit la réaction déciduale, d’un point de vue morphologique mais aussi en terme d’expression des deux gènes marqueurs cités ci-dessus. Une analyse par Chromatin ImmunoPrécipitation (ou ChIP) a démontré que LRH-1 se lie à des régions génomiques se trouvant en aval de certains gènes importants pour la décidualisation comme PRL, WNT 4, WNT 5, CDKN1A ou encore IL-24, et dans chacun de ces cas cités, cette capacité de liaison augmente dans le cadre de la décidualisation in vitro. Par ailleurs, des études structurelles ont identifié les phospholipides comme des ligands potentiels pour LRH-1. Nous avons donc choisi d’orienter notre travail de façon à explorer les effets sur les ligands liés à LRH-1 de traitements impliquant des agonistes et antagonistes à notre récepteur nucléaire. Les analyses par q-PCR et Western blot ont montré que la modulation de l’activité de LRH-1 par ses ligands influait aussi sur la réaction déciduale. Enfin, des études récentes de Salker et al (Salker, Teklenburg et al. 2010) ont mis en évidence que les cellules stromales humaines décidualisées sont de véritables biocapteurs de la qualité embryonnaire et qu’elles ont la capacité de migrer en direction de l’embryon. La série d’expériences que nous avons réalisée à l’aide de cellules hESC placées en co-culture avec des embryons de souris confirme que la migration cellulaire est bien dirigée vers les embryons. Cette propriété quant à l’orientation de la migration cellulaire est notoirement diminuée dans le cas où l’expression de LRH-1 est déplétée par shRNA dans les hESC. Nos données prouvent donc que LRH-1 régule non seulement la transcription d’un ensemble de gènes impliqués dans le processus de décidualisation mais agit aussi sur la motilité directionnelle de ces cellules hESC décidualisées in vitro.
Resumo:
Arrière-plan: les cellules tumorales circulantes (CTC) sont détectables dans de nombreux cancers et peuvent être utiles cliniquement pour le pronostic de la maladie, pour mesurer la récidive et pour prédire la sensibilité aux medicaments chimiothérapeutiques. Au cours des dernières années, l’études des CTC dans de nombreux cancers tels que le cancer du sein, du poumon, du côlon et de la prostate a grandement évolué. Alternativement, il y peu d'études à ce sujet concernant le cancer du col de l’utérus (CCU). Objectifs: Notre objectif est d’optimiser le processus d'enrichissement des CTC dans le CCU et la détection moléculaire des biomarqueurs E6 et E7. Matériel et Méthodes: Dans l’optique de mimer la présence de CTC dans le sang, nous avons dilué des cellules cancéreuses CaSki VPH16-positif provenant d’un CCU dans du sang humain prélevé sur des volontaires sains. Les CaSki ont été collectées suite à une centrifugation par densité avec le Ficoll, la lyse des globules rouges (RBC) et la lyse des RBC combinée avec un enrichissement positif et négatif à l’aide de marqueurs de surface cellulaire. Les CTC ont été détectées par la mesure d’expression des oncogènes E6 et E7 du virus du papillome humain (VPH), de la cytokératine 19 (CK19) et de la cycline p16INK4 en utilisant la technique quantitative en temps réel de Reverse Transcriptase-Polymerase Chain Reaction (qRT-PCR). Pour valider notre méthode de détection des CTC in vivo, nous avons recruté dix patientes atteintes d’un CCU VPH16 positif et six contrôles sains. Résultats: Dans le modèle de dilutions de cellules CaSki, la lyse des RBC seule ou combinée avec l'enrichissement négatif ou positif suggèrent des limites de détection de 1 CTC par mL de sang pour tous les biomarqueurs moléculaires utilisés. La sensibilité de détection est accrue lors de l'utilisation de l’enrichissement positif et négatif en réduisant le bruit de fond causé par les monocytes sanguins. Contrairement aux oncogènes E6 et E7, les marqueurs CK19 et p16INK4A ont été détectés chez des individus sains, les niveaux d'expression de base appropriés doivent donc être déterminés avec précision par rapport aux patientes CCU. Le gradient de densité par Ficoll a une limite de détection de seulement environ 1000 cellules par mL de sang. Enfin, les CTC ont été détectées dans 2/10 patientes en utilisant le marqueur CK19. Cependant, ces patientes étaient négatives pour les oncogènes E6/E7. Le marqueur p16INK4A était exprimé au même niveau dans tous les échantillons (CCU et normaux). Conclusion: Notre étude suggère que les oncogènes E6 et E7 du VPH16 sont les marqueurs biologiques les plus sensibles et spécifiques en qRT-PCR pour détecter les CTC dans le modèle de dilution de cellules de CCU dans le sang. Chez les patientes atteintes d’un CCU de stade précoce, seulement CK19 a révélé la présence potentielle de CTC, ce qui suggère que ces cellules sont rares à ce stade de la maladie. Mots clés: cancer du col de l’utérus, cellules tumorales circulantes, RT-qPCR, E6 et E7, CK19, p16INK4A, enrichissement immunomagnétique, détection moléculaire.
Resumo:
L’organisation cellulaire repose sur une distribution organisée des macromolécules dans la cellule. Deux ARNm, cen et ik2, montrent une colocalisation parfaite aux centrosomes. Ces deux gènes font partie du même locus sur le chromosome 2L de Drosophila melanogaster et leur région 3’ non traduite (3’UTR) se chevauchent. Dans le mutant Cen, le transport de Ik2 est perturbé, mais dans le mutant Ik2, la localisation de cen n’est aucunement affectée. Ces résultats suggèrent que cen est le régulateur principal de la co-localisation de cen et ik2 aux centrosomes et que cette co-localisation se produit par un mécanisme impliquant la région complémentaire au niveau du 3’UTR des deux transcrits. La localisation de cen au niveau des centrosomes dans les cellules épithéliales de l’embryon est conservée dans différentes espèces de Drosophile : D. melanogater, D. simulans, D. virilis et D. mojavensis. Cependant, la localisation de ik2 n’est pas conservée dans D. virilis et D. mojavensis, deux espèces dont les gènes cen et ik2 sont dissociés dans le génome. Ces résultats suggèrent que la proximité de Cen et Ik2 dans le génome est importante afin d’avoir un événement de co-localisation de ces deux transcrits. J’ai généré différentes lignées de mouches transgéniques dans lesquelles un transgène contenant la séquence GFP fusionnée à différentes partie de Cen (partie codante, 3’UTR, Cod+3’UTR) qui sont sous le contrôle du promoteur UAS et qui sont gal4 inductibles. La région codante de l’ARNm cen était suffisante pour avoir un ciblage précis du transcrit aux centrosomes.
Resumo:
Microarray data analysis is one of data mining tool which is used to extract meaningful information hidden in biological data. One of the major focuses on microarray data analysis is the reconstruction of gene regulatory network that may be used to provide a broader understanding on the functioning of complex cellular systems. Since cancer is a genetic disease arising from the abnormal gene function, the identification of cancerous genes and the regulatory pathways they control will provide a better platform for understanding the tumor formation and development. The major focus of this thesis is to understand the regulation of genes responsible for the development of cancer, particularly colorectal cancer by analyzing the microarray expression data. In this thesis, four computational algorithms namely fuzzy logic algorithm, modified genetic algorithm, dynamic neural fuzzy network and Takagi Sugeno Kang-type recurrent neural fuzzy network are used to extract cancer specific gene regulatory network from plasma RNA dataset of colorectal cancer patients. Plasma RNA is highly attractive for cancer analysis since it requires a collection of small amount of blood and it can be obtained at any time in repetitive fashion allowing the analysis of disease progression and treatment response.
Resumo:
Post-transcriptional gene silencing by RNA interference is mediated by small interfering RNA called siRNA. This gene silencing mechanism can be exploited therapeutically to a wide variety of disease-associated targets, especially in AIDS, neurodegenerative diseases, cholesterol and cancer on mice with the hope of extending these approaches to treat humans. Over the recent past, a significant amount of work has been undertaken to understand the gene silencing mediated by exogenous siRNA. The design of efficient exogenous siRNA sequences is challenging because of many issues related to siRNA. While designing efficient siRNA, target mRNAs must be selected such that their corresponding siRNAs are likely to be efficient against that target and unlikely to accidentally silence other transcripts due to sequence similarity. So before doing gene silencing by siRNAs, it is essential to analyze their off-target effects in addition to their inhibition efficiency against a particular target. Hence designing exogenous siRNA with good knock-down efficiency and target specificity is an area of concern to be addressed. Some methods have been developed already by considering both inhibition efficiency and off-target possibility of siRNA against agene. Out of these methods, only a few have achieved good inhibition efficiency, specificity and sensitivity. The main focus of this thesis is to develop computational methods to optimize the efficiency of siRNA in terms of “inhibition capacity and off-target possibility” against target mRNAs with improved efficacy, which may be useful in the area of gene silencing and drug design for tumor development. This study aims to investigate the currently available siRNA prediction approaches and to devise a better computational approach to tackle the problem of siRNA efficacy by inhibition capacity and off-target possibility. The strength and limitations of the available approaches are investigated and taken into consideration for making improved solution. Thus the approaches proposed in this study extend some of the good scoring previous state of the art techniques by incorporating machine learning and statistical approaches and thermodynamic features like whole stacking energy to improve the prediction accuracy, inhibition efficiency, sensitivity and specificity. Here, we propose one Support Vector Machine (SVM) model, and two Artificial Neural Network (ANN) models for siRNA efficiency prediction. In SVM model, the classification property is used to classify whether the siRNA is efficient or inefficient in silencing a target gene. The first ANNmodel, named siRNA Designer, is used for optimizing the inhibition efficiency of siRNA against target genes. The second ANN model, named Optimized siRNA Designer, OpsiD, produces efficient siRNAs with high inhibition efficiency to degrade target genes with improved sensitivity-specificity, and identifies the off-target knockdown possibility of siRNA against non-target genes. The models are trained and tested against a large data set of siRNA sequences. The validations are conducted using Pearson Correlation Coefficient, Mathews Correlation Coefficient, Receiver Operating Characteristic analysis, Accuracy of prediction, Sensitivity and Specificity. It is found that the approach, OpsiD, is capable of predicting the inhibition capacity of siRNA against a target mRNA with improved results over the state of the art techniques. Also we are able to understand the influence of whole stacking energy on efficiency of siRNA. The model is further improved by including the ability to identify the “off-target possibility” of predicted siRNA on non-target genes. Thus the proposed model, OpsiD, can predict optimized siRNA by considering both “inhibition efficiency on target genes and off-target possibility on non-target genes”, with improved inhibition efficiency, specificity and sensitivity. Since we have taken efforts to optimize the siRNA efficacy in terms of “inhibition efficiency and offtarget possibility”, we hope that the risk of “off-target effect” while doing gene silencing in various bioinformatics fields can be overcome to a great extent. These findings may provide new insights into cancer diagnosis, prognosis and therapy by gene silencing. The approach may be found useful for designing exogenous siRNA for therapeutic applications and gene silencing techniques in different areas of bioinformatics.
Resumo:
Das Protein Orb2, welches zum Xenopus CPEB homolog ist, erfüllt während der Spermatogenese von Drosophila melanogaster eine wesentliche Funktion. Das teilweise Ausschalten von orb2 führt zu Störungen in der Individualisierung der Spermatiden, Veränderung in der Morphologie und Lokalisation der Spermatidenkerne und damit verbunden zu männlicher Sterilität. Der weit gestreute Phänotyp spricht für eine regulatorische Funktion des Proteins, wie es aufgrund der Homologie zu CPEB zu erwarten ist. Orb2 mutante Weibchen zeigen dagegen keinen Phänotyp. Die Sterilität konnte mit spezifischen Rettungskonstrukten rückgängig gemacht werden, wobei die beiden Proteinformen in ihrer Funktion höchstwahrscheinlich äquivalent sind, da eine größere Menge an kleinem Protein das Fehlen des größeren ausgleichen kann. Beide Proteinformen lokalisieren in fast alle Stadien der Spermatogenese, wobei nur das kleinere auch in reifen Spermien persistiert. Zur Untersuchung der regulatorischen Funktion des Proteins Orb2 wurden zunächst drei mögliche Protein-Interaktionskandidaten analysiert. Obwohl ähnliche mutante Phänotypen in Gap und Cup ausgelöst wurden, lässt sich eine Interaktion bis jetzt mit diesen Kandidaten weder ausschließen noch bestätigen. Daneben zeigte das Protein Tob eine ähnliche Lokalisierung und einen deutlich ähnlicheren mutanten Phänotyp, wie er für Orb2 beschrieben wurde. Besonders auffällig ist die Lokalisation der Tob mRNA an die Spermatidenenden und die Verringerung der Transkriptmenge in der orb2-Mutante. Ob dieser Phänotyp durch den Verlust der regulatorischen Funktion von Orb2 hervorgerufen wird oder durch den späten Zeitpunkt der Transkription bedingt ist, muß in späteren Experimenten geklärt werden. Mit Hilfe eines Co-Immunpräzipitations-Experimentes wurde nach weiteren Proteininteraktionspartnern sowie nach Ziel-mRNAs gesucht, die durch Orb2 reguliert werden könnten. Dabei ergaben die massenspektrometrischen Analysen zwar Proteine, die mit der Translation selbst in Zusammenhang stehen, sowie einige regulatorische RNA-bindende Proteine, wiesen aber auch in Gestalt eines häufig nachgewiesenen Anhangsdrüsenproteins auf deutliche systematische Probleme hin. Auf genetischem Wege war bereits der Nachweis gelungen, dass die Protamine und mst77F, die strukturelle Komponenten der kompaktierten Kern-DNA sind, durch Orb2 in ihrer Translation reprimiert werden. Dieses Ergebnis wurde zum Teil bestätigt durch den Nachweis der Protamin mRNAs in den Eluaten aus dem Co-Immunpräzipitationsexperiment. Damit konnte zum ersten Mal in der Drosophila Spermatogenese das regulatorische Protein zu einer translationskontrollierten mRNA identifiziert werden.
Resumo:
ERI-1 und ihm homologe Proteine sind 3‘-5‘ Exoribonukleasen mit konservierten Funktionen in der Regulation von RNA Silencing sowie der Prozessierung ribosomaler RNA. Caenorhabditis elegans ERI-1 (Enhanced RNAi 1) enthält eine konservierte ERI-1_3’hExo_like EXOIII-Domäne, die siRNAs in vitro bindet und degradiert, und deren Inaktivierung eine RNAi-Hypersensitivität zur Folge hat. ERI-1 ist phylogenetisch konserviert, und homologe Proteine wurden Reiche-übergreifend in einer Vielzahl von Modellorganismen identifiziert. RNA-Silencing-reprimierende Eigenschaften dieser Proteine wurden in einigen Fällen charakterisiert. Zusätzlich wurde für eine Untergruppe ERI-1-homologer Proteine eine Funktion in der Biogenese der 5.8S ribosomalen RNA aufgezeigt: Katalyse des letzten Prozessierungsschritts während der Reifung des 5.8S rRNA 3‘-Endes. Diese Doppelfunktion ERI-1-homologer Proteine schlägt eine interessante Brücke zwischen evolutionär weit entfernten auf nicht-codierender RNA basierenden Mechanismen. In dieser Arbeit werden Ergebnisse präsentiert, die Charakteristika des pflanzlichen ERI-1-Homologs ERL1 in verschiedenen regulatorischen Zusammenhängen zum Gegenstand haben. ERL1 lokalisiert in Chloroplasten und zeigt keinerlei messbare Aktivität in Bezug auf die Regulierung von RNA Silencing. Im Gegensatz dazu konnte gezeigt werden, dass ERL1 eine wichtige Rolle während der Reifung der chloroplastischen 5S rRNA spielt. ERL1-supprimierende bzw. -überexprimierende transgene Pflanzen, zeigen unterschiedliche phänotypische Aberrationen. Diese beinhalten vielfarbige Blätter, reduziertes Wachstum und Fruchtbarkeit, sowie den Verlust Photosynthese-kompetenter Chloroplasten in gebleichten Sektoren. Diese Defekte werden dadurch verursacht, dass die Plastid-Entwicklung in einem frühen Stadium blockiert wird. Dies führt zu defekten Plastiden, die keine kanonischen internen Strukturen, einschließlich Grana, bilden können. Die gestörte Plastid-Entwicklung ist ein Resultat fehlerhafter Prozessierung ribosomaler RNAs und dem daraus folgenden Verlust plastidärer Transkription und Translation. Wenn ERL1 runterreguliert oder überexprimiert ist, akkumulieren 3‘-elongierte 5S rRNA-Moleküle, was Störungen in der Produktion der Ribosomen hervorruft. Die Reifung der 5S rRNA ist leit langem als Prozess bekannt, der viele aufeinander folgende endonukleolytische Spaltungen sowie exonukleolytische Rezessionen beinhaltet. Bis dato war die Gesamtheit der Exonukleasen während dieser Reifung jedoch nur lückenhaft bekannt. Die Ergebnisse dieser Arbeit zeigen, dass ERL1 eine wichtige Rolle in der Plastid-Entwicklung spielt, indem ERL1 den finalen Reifungsschritt des 5S rRNA 3‘-Endes katalysiert.
Resumo:
Dictyostelium discoideum is a social amoeba that serves as a model system for RNA interference and related mechanisms. Its position between plants and animals enables evolutionary snapshot of mechanisms and protein machinery involved in investigated subjects. MiRNAs are small regulatory RNAs that are evolutionary conserved and present in animals, plants, viruses and some prokaryotes. They have roles in development, cell growth and differentiation, apoptosis and their miss-regulation is associated with many diseases such as cancer, neurodegenerative disorders and diabetes. Recently, through sequencing of DNA libraries miRNAs have been discovered in D. discoideum. In this work, it has been shown that heterologues miRNA let-7 can be expressed and processed in D. discoideum. Expression of let-7 miRNA in social amoeba resulted in a strong developmental phenotype suggesting an overload of the processing/silencing system or/and endogenous targets. The various effects on prel-7 strain have been observed and characterized, serving as a background for postulation of miRNA roles. An artificial miRNA system has been established and imposed to D. discoideum, showing that miRNAs in Dictyostelium could mediate gene expression on the level of mRNA stability and on the posttranscriptional level. Furthermore, presence of translational inhibition as a type of gene control was shown for the first time in this organism. Due to it new structures representing co-localities of miRNA and target mRNA have been detected. Taken together, this work shows functional artificial miRNA system and postulates roles of endogenous small RNA in social amoeba.
Resumo:
Obwohl die DNA Methyltransferase 2 (Dnmt2) hoch konserviert ist und zu der am weitesten verbreiteten eukaryotischen MTase-Familie gehört, ist ihre biologische Funktion nach wie vor unklar. Nachdem lange Zeit keine DNA Methylierungsaktivität nachgewiesen werden konnte, wurde vor einigen Jahren über geringe Mengen an 5-Methylcytosin (5mC) in Retroelementen der “Dnmt2-only”-Organismen D. melanogaster, D. discoideum und E. histolytica berichtet (Kunert et al. 2003; Fisher et al. 2004; Kuhlmann et al. 2005; Phalke et al. 2009). Als kurze Zeit später robuste Methylierung der tRNAAsp durch humane Dnmt2 gezeigt wurde (Goll et al. 2006), wurde zunächst eine Dualspezifität des Enzyms vorgeschlagen (Jeltsch et al. 2006). Neuere Daten zum 5mC-Status verschiedener „Dnmt2-only“-Organismen bilden Anlass für kontroverse Diskussionen über Ausmaß und Bedeutung der DNA Methyltransferaseaktivität von Dnmt2 (Schaefer et al. 2010a; Krauss et al. 2011). Die vorliegende Arbeit konzentriert sich auf die Identifizierung neuer RNA Substrate des Dnmt2-Homologs DnmA aus D. discoideum sowie die biologische Bedeutung der tRNA-Methylierung durch Dnmt2. Wie in anderen Organismen beschrieben, fungiert auch DnmA als tRNAAsp(GUC) MTase in vitro und in vivo. Zusätzlich konnte in vitro tRNAGlu(UUC) als neues Substrat der Dnmt2-Homologe aus D. discoideum und dem Menschen identifiziert werden. In einem Kooperationsprojekt wurde außerdem auch tRNAAsp-Methylierungsaktivität für das Dnmt2-Homolog aus S. pombe (Pmt1) nachgewiesen. Crosslink-RNA-Immunopräzipitationen (RNA-CLIP) mit anschließender Next-Generation-Sequenzierung der mit DnmA assoziierten RNAs zeigen, dass DnmA mit tRNA Fragmenten interagiert, die sich vom Anticodonloop bis in den T-loop erstrecken. Neben der tRNAAsp(GUC) und tRNAGlu(UUC/CUC) sind Fragmente der tRNAGly(GCC) verstärkt angereichert. Inwiefern diese Fragmente eine biologische Funktion haben oder spezifische Degradationsprodukte darstellen, ist noch ungeklärt. Interessanterweise sind von einigen tRNAs wenige Sequenzen von antisense-Fragmenten in den RNA-CLIP Daten zu finden, die etwas kürzer, jedoch exakt komplementär zu den genannten sense-Fragmenten sind. Besonders stark sind diese Fragmente der tRNAGlu(UUC) vertreten. In einem weiteren RNA-CLIP Experiment wurden U-snRNAs, snoRNA und intergenische Sequenzen mit DnmA angereichert. Bei nachfolgenden in vitro Methylierungsstudien konnte ausschließlich die U2-snRNA als potentielles Nicht-tRNA-Substrat der hDnmt2 und DnmA identifiziert werden. Da tRNA Modifikationen im Anticodonloop die Codonerkennung beeinflussen können, wurde ein System etabliert um die Translationseffizienz eines GFP-Reportergens in Wildtyp- und dnmAKO-Zellen zu messen. In D. discoideum wird das Aspartat-Codon GAU ca. zehnmal häufiger genutzt als das GAC Codon, allerdings ist nur eine tRNAAsp(GUC) im Genom der Amöbe kodiert. Aus diesem Grund wurde zusätzlich die Frage adressiert, inwiefern die DnmA-abhängige Methylierung dieser tRNA das „Wobbling“ beeinflusst. Dazu wurde dem Reportergen jeweils eine (GAU)5- und (GAC)5-Leadersequenz vorgeschaltet. Entgegen der Annahme wurde der (GAC)5-Leader in beiden Stämmen etwas effizienter translatiert. Insgesamt zeigte der dnmAKO-Stamm eine leicht erhöhte Translationseffizienz der Reportergene. Vergleichende Analysen zur Aufnahme von Fremd-DNA zeigten signifikant reduzierte Transformationseffizienzen mit einem integrierenden Plasmid in dnmAKO-Zellen. Ein weiterer dnmAKO-Stamm zeigte diesen Effekt jedoch nicht, wobei bei derselben Mutante eine deutlich reduzierte Aufnahme eines extrachromosomalen Plasmids zu verzeichnen war. Untersuchungen zum Einfluss von DnmA auf die Regulation des Retroelements skipper ergaben keinen Zusammenhang zwischen der Generierung kleiner RNAs und der erhöhten Transkription des Retrotransposons in dnmAKO-Zellen (Kuhlmann et al. 2005). Durch Kompensationsversuche sowie Experimente mit einer weiteren dnmAKO-Mutante konnte die Mobilisierung des Retrotransposons nicht eindeutig als DnmA-Funktion eingeordnet werden. In einem weiteren Projekt wurden die Bindung des m5C-bindenden Proteins EhMLBP aus E. histolytica an DNA mittels Rasterkraftmikroskopie abgebildet (Lavi et al. 2006). Neben vermutlich unspezifischen Endbindungsereignissen konnte eine bevorzugte Bindungsstelle des Proteins an LINE DNA (long intersperesed nuclear element) identifiziert werden. Möglicherweise fällt diese mit einem von zwei A/T-reichen Bereichen der LINE DNA zusammen, von denen vermutet wird, dass diese für die Bindung von EhMLBP an DNA von Bedeutung sind. Insgesamt bestätigen die Ergebnisse dieser Arbeit die tRNAAsp Methylierungsaktivität als konservierte Dnmt2-Funktion. Darüber hinaus erweitern sie das Substratspektrum der Dnmt2-Methyltransferasen im Bereich der tRNA. Außerdem wird erstmals ein potentielles Nicht-tRNA Substrat vorgeschlagen. Zusätzlich geben neu entdeckte Phänotypen Hinweise auf vielfältige zelluläre Dnmt2-Funktionen.
Resumo:
Argonauten Proteine übernehmen vielfältige Funktionen in RNA vermittelten Signalwegen zur Genregulation und sind in eukaryotischen Organismen hoch konserviert. Obwohl das Repertoire an kleinen regulatorischen RNAs in D. discoideum schon früh untersucht wurde und dabei sowohl siRNAs als auch miRNAs identifiziert werden konnten, war die Funktion der fünf kodierten Argonauten Proteine zu Beginn meiner Arbeit noch völlig unbekannt. Im Fokus meiner Untersuchung standen die zwei Homologe AgnA und AgnB. Die molekularbiologische Charakterisierung von AgnA hat gezeigt, dass das Protein eine essentielle Funktion bei der posttranskriptionellen Regulation des Retrotransposons DIRS-1 hat. AgnA wird für die Generierung von über 90 % der DIRS-1 siRNAs benötigt, wobei unklar ist, ob die Slicer-Aktivität des Proteins relevant ist oder ob AgnA andere Proteine zur Generierung der kleinen RNAs rekrutiert. Mit Hilfe der Deep Sequencing Analyse kleiner RNAs im AgnA KO konnte die Abreicherung der DIRS-1 siRNAs bestätigt werden. Die Anreicherung von DIRS-1 sense und antisense Transkripten weist deutlich auf eine Deregulation des Retrotransposons bei Abwesenheit von AgnA hin. Der Verlust der AgnA abhängigen Regulationsebene ist nicht nur auf RNA- sondern auch auf DNA-Ebene nachweisbar, da im AgnA Knockout einzelsträngige extrachromosomale DIRS-1 Intermediate nachweisbar sind. Die Analyse dieser Strukturen mit Hilfe von Rasterkraftmikroskopie zeigt, dass die extrachromosomale DNA mit Proteinen assoziiert ist. Das Erscheinungsbild legt die Vermutung nahe, dass es sich um Virus ähnliche Partikel handeln könnte. Die Transposition der DIRS-1 Elemente konnte nicht nachgewiesen werden. Sie schlägt vermutlich fehl, da der zur Integration notwendige DNA-Doppelstrang nicht gebildet wird. Auch wenn der genaue Mechanismus der AgnA abhängigen DIRS-1 Regulation nicht vollständig aufgeklärt werden konnte, weisen die Ergebnisse darauf hin, dass AgnA nicht nur an der Biogenese der kleinen DIRS-1 siRNAs beteiligt ist, sondern auch weiter downstream, vermutlich innerhalb von Effektorkomplexen, als Regulator aktiv ist. AgnB ist nicht an der negativen Regulation des DIRS-1 Retrotransposons beteiligt. Im Gegenteil haben Experimente gezeigt, dass das Protein die Transkription des Elementes und die Bildung von DNA-Intermediaten eher positiv beeinflusst. Im Fall des Retrotransposons Skipper ist unklar, ob die wenigen siRNAs, die identifiziert worden sind, tatsächlich für die Regulation dieses Elementes genutzt werden. Der Knockout von AgnA hat eine Anreicherung der Skipper siRNAs zur Folge, wobei diese sehr variabel ist. Es konnten Skipper Transkripte nachgewiesen werden (Hinas et al., 2007), die wahrscheinlich die Vorläufermoleküle der siRNAs darstellen. Die Menge dieser Transkripte unterscheidet sich allerdings im Wildtyp und den untersuchten Knockout-Stämmen nicht. Bei der Untersuchung der miRNAs zeigte sich eine signifikante Anreicherung dieser regulatorischen RNAs im AgnA Knockout. Die Akkumulation kann durch die Expression von rekombinantem AgnA wieder auf Wildtyp Niveau gebracht werden. Die genaue Funktion von AgnA im miRNA Signalweg konnte aber nicht näher spezifiziert werden. Im Fall der beiden miRNAs konnte im Rahmen dieser Arbeit nachgewiesen werden, dass sie keine 2‘-O Methylierung besitzen und fast ausschließlich im Cytoplasma der Zelle vorliegen. Letzteres weist darauf hin, dass die untersuchten miRNAs ihre Zielgene vermutlich posttranskriptionell regulieren. Die Akkumulation von miRNAs im AgnA KO konnte ebenfalls durch Deep Sequencing Analysen verifiziert werden. Weiterhin wurden tRNA Fragmente gefunden, die im AgnA KO wesentlich stärker vertreten sind. Northern Blot Analysen haben gezeigt, dass ein zusätzliches Fragment der tRNA Asp akkumuliert, wenn AgnA nicht exprimiert wird. Möglicherweise ist AgnA am Umsatz der tRNA beteiligt. Die biologische Funktion der tRNA Fragmente in D. discoideum ist jedoch bisher ungeklärt. Bei der Suche nach putativen Interaktionspartnern konnte im Fall von AgnA das Protein DDB_G0268914 mittels Massenspektrometrie als putativer Interaktionspartner identifiziert werden. Dieses Protein zeigt Homologien zu MOV10 aus H. sapiens, das ebenfalls mit Argonauten Proteinen interagiert (Hock et al., 2007) und die Replikation von Retroviren unterdrückt (Burdick et al., 2010). Die Interaktion zwischen AgnA und dem MOV10 Homolog konnte bisher nicht mit anderen Ansätzen bestätigt werden. Darüber hinaus bleibt zu klären, ob der putative Interaktionsparter ebenfalls an der Regulation des Retrotransposons DIRS-1 beteiligt ist.