988 resultados para Rna structure
The RNA phage Qβ requires for the replication of its genome an RNA binding protein called Qβ host factor or Hfq protein. Our previous results suggested that this protein mediates the access of replicase to the 3′-end of the Qβ plus strand RNA. Here we report the results of an evolutionary experiment in which phage Qβ was adapted to an Escherichia coli Q13 host strain with an inactivated host factor (hfq) gene. This strain initially produced phage at a titer ≈10,000-fold lower than the wild-type strain and with minute plaque morphology, but after 12 growth cycles, phage titer and plaque size had evolved to levels near those of the wild-type host. RNAs isolated from adapted Qβ mutants were efficient templates for replicase without host factor in vitro. Electron microscopy showed that mutant RNAs, in contrast to wild-type RNA, efficiently interacted with replicase at the 3′-end in the absence of host factor. The same set of four mutations in the 3′-terminal third of the genome was found in several independently evolved phage clones. One mutation disrupts the base pairing of the 3′-terminal CCCoh sequence, suggesting that the host factor stimulates activity of the wild-type RNA template by melting out its 3′-end.
While studies of the regulation of gene expression have generally concerned qualitative changes in the selection or the level of expression of a gene, much of the regulation that occurs within a cell involves the continuous subtle optimization of the levels of proteins used in macromolecular complexes. An example is the biosynthesis of the ribosome, in which equimolar amounts of nearly 80 ribosomal proteins must be supplied by the cytoplasm to the nucleolus. We have found that the transcript of one of the ribosomal protein genes of Saccharomyces cerevisiae, RPL32, participates in such fine tuning. Sequences from exon I of the RPL32 transcript interact with nucleotides from the intron to form a structure that binds L32 to regulate splicing. In the spliced transcript, the same sequences interact with nucleotides from exon II to form a structure that binds L32 to regulate translation, thus providing two levels of autoregulation. We now show, by using a sensitive cocultivation assay, that these RNA structures and their interaction with L32 play a role in the fitness of the cell. The change of a single nucleotide within the 5' leader of the RPL32 transcript, which abolishes the site for L32 binding, leads to detectably slower growth and to eventual loss of the mutant strain from the culture. Experiments designed to assess independently the regulation of splicing and the regulation of translation are presented. These observations demonstrate that, in evolutionary terms, subtle regulatory compensations can be critical. The change in structure of an RNA, due to alteration of just one noncoding nucleotide, can spell the difference between biological success and failure.
Our previous studies using trans-complementation analysis of Kunjin virus (KUN) full-length cDNA clones harboring in-frame deletions in the NS3 gene demonstrated the inability of these defective complemented RNAs to be packaged into virus particles (W. J. Liu, P. L. Sedlak, N. Kondratieva, and A. A. Khromykh, J. Virol. 76:10766-10775). In this study we aimed to establish whether this requirement for NS3 in RNA packaging is determined by the secondary RNA structure of the NS3 gene or by the essential role of the translated NS3 gene product. Multiple silent mutations of three computer-predicted stable RNA structures in the NS3 coding region of KUN replicon RNA aimed at disrupting RNA secondary structure without affecting amino acid sequence did not affect RNA replication and packaging into virus-like particles in the packaging cell line, thus demonstrating that the predicted conserved RNA structures in the NS3 gene do not play a role in RNA replication and/or packaging. In contrast, double frameshift mutations in the NS3 coding region of full-length KUN RNA, producing scrambled NS3 protein but retaining secondary RNA structure, resulted in the loss of ability of these defective RNAs to be packaged into virus particles in complementation experiments in KUN replicon-expressing cells. Furthermore, the more robust complementation-packaging system based on established stable cell lines producing large amounts of complemented replicating NS3-deficient replicon RNAs and infection with KUN virus to provide structural proteins also failed to detect any secreted virus-like particles containing packaged NS3-deficient replicon RNAs. These results have now firmly established the requirement of KUN NS3 protein translated in cis for genome packaging into virus particles.
A precise, reproducible deletion made during in vitro reverse transcription of RNA2 from the icosahedral positive-stranded Helicoverpa armigera stunt virus (Tetraviridae) is described. The deletion, located between two hexamer repeats, is a 50-base sequence that includes one copy of the hexamer repeat. Only the Moloney murine leukemia virus reverse transcriptase and its derivative Superscript I, carrying a deletion of the carboxy-terminal RNase H region, showed this response, indicating a template-switching mechanism different from one proposed that involves a RNase H-dependent strand transfer, Superscript II, however, which carries point mutations to reduce RNase H activity, does not cause a deletion. A possible mechanism involves the enzyme pausing at the 3' side of a stem-loop structure and the 3' end of the nascent DNA strand separating from the template and reannealing to the upstream hexamer repeat.
We describe the effect of guanidinylation of the aminoglycoside moiety on acridine-neamine-containing ligands for the stem-loop structure located at the exon 10-5′-intron junction of Tau pre-mRNA, an important regulatory element of tau gene alternative splicing. On the basis of dynamic combinatorial chemistry experiments, ligands that combine guanidinoneamine and two different acridines were synthesized and their RNA-binding properties were compared with those of their amino precursors. Fluorescence titration experiments and UV-monitored melting curves revealed that guanidinylation has a positive effect both on the binding affinity and specificity of the ligands for the stemloop RNA, as well as on the stabilization of all RNA sequences evaluated, particularly some mutated sequences associated with the development of FTDP-17 tauopathy. However, this correlation between binding affinity and stabilization due to guanidinylation was only found in ligands containing a longer spacer between the acridine and guanidinoneamine moieties, since a shorter spacer produced the opposite effect (e.g. lower binding affinity and lower stabilization). Furthermore, spectroscopic studies suggest that ligand binding does not significantly change the overall RNA structure upon binding (circular dichroism) and that the acridine moiety might intercalate near the bulged region of the stem->loop structure (UV-Vis and NMR spectroscopy).
La détermination de la structure tertiaire du ribosome fut une étape importante dans la compréhension du mécanisme de la synthèse des protéines. Par contre, l’élucidation de la structure du ribosome comme tel ne permet pas une compréhension de sa fonction. Pour mieux comprendre la nature des relations entre la structure et la fonction du ribosome, sa structure doit être étudiée de manière systématique. Au cours des dernières années, nous avons entrepris une démarche systématique afin d’identifier et de caractériser de nouveaux motifs structuraux qui existent dans la structure du ribosome et d’autres molécules contenant de l’ARN. L’analyse de plusieurs exemples d’empaquetage de deux hélices d’ARN dans la structure du ribosome nous a permis d’identifier un nouveau motif structural, nommé « G-ribo ». Dans ce motif, l’interaction d’une guanosine dans une hélice avec le ribose d’un nucléotide d’une autre hélice donne naissance à un réseau d’interactions complexes entre les nucléotides voisins. Le motif G-ribo est retrouvé à 8 endroits dans la structure du ribosome. La structure du G-ribo possède certaines particularités qui lui permettent de favoriser la formation d’un certain type de pseudo-nœuds dans le ribosome. L’analyse systématique de la structure du ribosome et de la ARNase P a permis d’identifier un autre motif structural, nommé « DTJ » ou « Double-Twist Joint motif ». Ce motif est formé de trois courtes hélices qui s’empilent l’une sur l’autre. Dans la zone de contact entre chaque paire d’hélices, deux paires de bases consécutives sont surenroulées par rapport à deux paires de bases consécutives retrouvées dans l’ARN de forme A. Un nucléotide d’une paire de bases est toujours connecté directement à un nucléotide de la paire de bases surenroulée, tandis que les nucléotides opposés sont connectés par un ou plusieurs nucléotides non appariés. L’introduction d’un surenroulement entre deux paires de bases consécutives brise l’empilement entre les nucléotides et déstabilise l’hélice d’ARN. Dans le motif DTJ, les nucléotides non appariés qui lient les deux paires de bases surenroulées interagissent avec une des trois hélices qui forment le motif, offrant ainsi une stratégie élégante de stabilisation de l’arrangement. Pour déterminer les contraintes de séquences imposées sur la structure tertiaire d’un motif récurrent dans le ribosome, nous avons développé une nouvelle approche expérimentale. Nous avons introduit des librairies combinatoires de certains nucléotides retrouvés dans des motifs particuliers du ribosome. Suite à l’analyse des séquences alternatives sélectionnées in vivo pour différents représentants d’un motif, nous avons été en mesure d’identifier les contraintes responsables de l’intégrité d’un motif et celles responsables d’interactions avec les éléments qui forment le contexte structural du motif. Les résultats présentés dans cette thèse élargissent considérablement notre compréhension des principes de formation de la structure d’ARN et apportent une nouvelle façon d’identifier et de caractériser de nouveaux motifs structuraux d’ARN.
Dans un premier temps, nous avons modélisé la structure d’une famille d’ARN avec une grammaire de graphes afin d’identifier les séquences qui en font partie. Plusieurs autres méthodes de modélisation ont été développées, telles que des grammaires stochastiques hors-contexte, des modèles de covariance, des profils de structures secondaires et des réseaux de contraintes. Ces méthodes de modélisation se basent sur la structure secondaire classique comparativement à nos grammaires de graphes qui se basent sur les motifs cycliques de nucléotides. Pour exemplifier notre modèle, nous avons utilisé la boucle E du ribosome qui contient le motif Sarcin-Ricin qui a été largement étudié depuis sa découverte par cristallographie aux rayons X au début des années 90. Nous avons construit une grammaire de graphes pour la structure du motif Sarcin-Ricin et avons dérivé toutes les séquences qui peuvent s’y replier. La pertinence biologique de ces séquences a été confirmée par une comparaison des séquences d’un alignement de plus de 800 séquences ribosomiques bactériennes. Cette comparaison a soulevée des alignements alternatifs pour quelques unes des séquences que nous avons supportés par des prédictions de structures secondaires et tertiaires. Les motifs cycliques de nucléotides ont été observés par les membres de notre laboratoire dans l'ARN dont la structure tertiaire a été résolue expérimentalement. Une étude des séquences et des structures tertiaires de chaque cycle composant la structure du Sarcin-Ricin a révélé que l'espace des séquences dépend grandement des interactions entre tous les nucléotides à proximité dans l’espace tridimensionnel, c’est-à-dire pas uniquement entre deux paires de bases adjacentes. Le nombre de séquences générées par la grammaire de graphes est plus petit que ceux des méthodes basées sur la structure secondaire classique. Cela suggère l’importance du contexte pour la relation entre la séquence et la structure, d’où l’utilisation d’une grammaire de graphes contextuelle plus expressive que les grammaires hors-contexte. Les grammaires de graphes que nous avons développées ne tiennent compte que de la structure tertiaire et négligent les interactions de groupes chimiques spécifiques avec des éléments extra-moléculaires, comme d’autres macromolécules ou ligands. Dans un deuxième temps et pour tenir compte de ces interactions, nous avons développé un modèle qui tient compte de la position des groupes chimiques à la surface des structures tertiaires. L’hypothèse étant que les groupes chimiques à des positions conservées dans des séquences prédéterminées actives, qui sont déplacés dans des séquences inactives pour une fonction précise, ont de plus grandes chances d’être impliqués dans des interactions avec des facteurs. En poursuivant avec l’exemple de la boucle E, nous avons cherché les groupes de cette boucle qui pourraient être impliqués dans des interactions avec des facteurs d'élongation. Une fois les groupes identifiés, on peut prédire par modélisation tridimensionnelle les séquences qui positionnent correctement ces groupes dans leurs structures tertiaires. Il existe quelques modèles pour adresser ce problème, telles que des descripteurs de molécules, des matrices d’adjacences de nucléotides et ceux basé sur la thermodynamique. Cependant, tous ces modèles utilisent une représentation trop simplifiée de la structure d’ARN, ce qui limite leur applicabilité. Nous avons appliqué notre modèle sur les structures tertiaires d’un ensemble de variants d’une séquence d’une instance du Sarcin-Ricin d’un ribosome bactérien. L’équipe de Wool à l’université de Chicago a déjà étudié cette instance expérimentalement en testant la viabilité de 12 variants. Ils ont déterminé 4 variants viables et 8 létaux. Nous avons utilisé cet ensemble de 12 séquences pour l’entraînement de notre modèle et nous avons déterminé un ensemble de propriétés essentielles à leur fonction biologique. Pour chaque variant de l’ensemble d’entraînement nous avons construit des modèles de structures tertiaires. Nous avons ensuite mesuré les charges partielles des atomes exposés sur la surface et encodé cette information dans des vecteurs. Nous avons utilisé l’analyse des composantes principales pour transformer les vecteurs en un ensemble de variables non corrélées, qu’on appelle les composantes principales. En utilisant la distance Euclidienne pondérée et l’algorithme du plus proche voisin, nous avons appliqué la technique du « Leave-One-Out Cross-Validation » pour choisir les meilleurs paramètres pour prédire l’activité d’une nouvelle séquence en la faisant correspondre à ces composantes principales. Finalement, nous avons confirmé le pouvoir prédictif du modèle à l’aide d’un nouvel ensemble de 8 variants dont la viabilité à été vérifiée expérimentalement dans notre laboratoire. En conclusion, les grammaires de graphes permettent de modéliser la relation entre la séquence et la structure d’un élément structural d’ARN, comme la boucle E contenant le motif Sarcin-Ricin du ribosome. Les applications vont de la correction à l’aide à l'alignement de séquences jusqu’au design de séquences ayant une structure prédéterminée. Nous avons également développé un modèle pour tenir compte des interactions spécifiques liées à une fonction biologique donnée, soit avec des facteurs environnants. Notre modèle est basé sur la conservation de l'exposition des groupes chimiques qui sont impliqués dans ces interactions. Ce modèle nous a permis de prédire l’activité biologique d’un ensemble de variants de la boucle E du ribosome qui se lie à des facteurs d'élongation.
Les interactions entre les squelettes sucre-phosphate de nucléotides jouent un rôle important dans la stabilisation des structures tertiaires de larges molécules d’ARN. Elles sont régies par des règles particulières qui gouverne leur formation mais qui jusque là demeure quasiment inconnues. Un élément structural d’ARN pour lequel les interactions sucre-phosphate sont importantes est le motif d’empaquetage de deux doubles hélices d’ARN le long du sillon mineur. Ce motif se trouve à divers endroits dans la structure du ribosome. Il consiste en deux doubles hélices interagissant de manière à ce que le squelette sucre-phosphate de l’une se niche dans le sillon mineur de l’autre et vice versa. La surface de contact entre les deux hélices est majoritairement formée par les riboses et implique au total douze nucléotides. La présente thèse a pour but d’analyser la structure interne de ce motif et sa dépendance de stabilité résultant de l’association optimale ou non des hélices, selon leurs séquences nucléotidiques. Il est démontré dans cette thèse qu’un positionnement approprié des riboses leur permet de former des contacts inter-hélices, par l’entremise d’un choix particulier de l’identité des pairs de bases impliquées. Pour différentes pairs de bases participant à ce contact inter-hélices, l’identité optimale peut être du type Watson-Crick, GC/CG, or certaines pairs de bases non Watson-Crick. Le choix adéquat de paires de bases fournit une interaction inter-hélice stable. Dans quelques cas du motif, l’identité de certaines paires de bases ne correspond pas à la structure la plus stable, ce qui pourrait refléter le fait que ces motifs devraient avoir une liberté de formation et de déformation lors du fonctionnement du ribosome.
DsrA is an 87-nt untranslated RNA that regulates both the global transcriptional silencer and nucleoid protein H-NS and the stationary phase and stress response sigma factor RpoS (σs). We demonstrate that DsrA acts via specific RNA:RNA base pairing interactions at the hns locus to antagonize H-NS translation. We also give evidence that supports a role for RNA:RNA interactions at the rpoS locus to enhance RpoS translation. Negative regulation of hns by DsrA is achieved by the RNA:RNA interaction blocking translation of hns RNA. In contrast, results suggest that positive regulation of rpoS by DsrA occurs by formation of an RNA structure that activates a cis-acting translational operator. Sequences within DsrA complementary to three additional genes, argR, ilvIH, and rbsD, suggest that DsrA is a riboregulator of gene expression that acts coordinately via RNA:RNA interactions at multiple loci.
The regulation of human immunodeficiency virus type 1 (HIV-1) gene expression in response to Tat is dependent on an element downstream of the HIV-1 transcriptional initiation site designated the trans-activating region (TAR). TAR forms a stable stem-loop RNA structure in which a 3-nt bulge structure and a 6-nt loop structure are important for Tat activation. In the absence of Tat, the HIV-1 promoter generates so-called short or nonprocessive transcripts terminating at +60, while in the presence of Tat the synthesis of these short transcripts is markedly decreased and transcripts that extend through the 9.0-kb HIV-1 genome are synthesized. Tat effects on transcriptional elongation are likely due to alterations in the elongation properties of RNA polymerase II. In this study we demonstrated that a set of cellular cofactors that modulate the binding of the cellular protein TRP-185 to the TAR RNA loop sequences also functioned to markedly stimulate the specific binding of hypophosphorylated (IIa) and hyperphosphorylated (IIo) RNA polymerase II to TAR RNA. The concentrations of RNA polymerase II required for this interaction with TAR RNA were similar to those required to initiate in vitro transcription from the HIV-1 long terminal repeat. RNA gel retardation analysis with wild-type and mutant TAR RNAs indicated that the TAR RNA loop and bulge sequences were critical for the binding of RNA polymerase II. The addition of wild-type but not mutant Tat protein to gel retardation analysis with TAR RNA and RNA polymerase II resulted in the loss of binding of RNA polymerase II binding to TAR RNA. These results suggest that Tat may function to alter RNA polymerase II, which is paused due to its binding to HIV-1 TAR RNA with resultant stimulation of its transcriptional elongation properties.
Thesis (Ph.D.)--University of Washington, 2016-06
The genome of some icosahedral RNA viruses plays an essential role in capsid assembly and structure. In T=3 particles of the nodavirus Pariacoto virus (PaV), a remarkable 35% of the single-stranded RNA genome is icosahedrally ordered. This ordered RNA can be visualized at high resolution by X-ray crystallography as a dodecahedral cage consisting of 30 24-nucleotide A-form RNA duplex segments that each underlie a twofold icosahedral axis of the virus particle and interact extensively with the basic N-terminal region of 60 subunits of the capsid protein. To examine whether the PaV genome is a specific determinant of the RNA structure, we produced virus-like particles (VLPs) by expressing the wild-type capsid protein open reading frame from a recombinant baculovirus. VLPs produced by this system encapsidated similar total amounts of RNA as authentic virus particles, but only about 6% of this RNA was PaV specific, the rest being of cellular or baculovirus origin. Examination of the VLPs by electron cryomicroscopy and image reconstruction at 15.4-Angstrom resolution showed that the encapsidated RNA formed a dodecahedral cage similar to that of wild-type particles. These results demonstrate that the specific nucleotide sequence of the PaV genome is not required to form the dodecahedral cage of ordered RNA.
Turnip crinkle virus (TCV) and Pea enation mosaic virus (PEMV) are two positive (+)-strand RNA viruses that are used to investigate the regulation of translation and replication due to their small size and simple genomes. Both viruses contain cap-independent translation elements (CITEs) within their 3´ untranslated regions (UTRs) that fold into tRNA-shaped structures (TSS) according to nuclear magnetic resonance and small angle x-ray scattering analysis (TCV) and computational prediction (PEMV). Specifically, the TCV TSS can directly associate with ribosomes and participates in RNA-dependent RNA polymerase (RdRp) binding. The PEMV kissing-loop TSS (kl-TSS) can simultaneously bind to ribosomes and associate with the 5´ UTR of the viral genome. Mutational analysis and chemical structure probing methods provide great insight into the function and secondary structure of the two 3´ CITEs. However, lack of 3-D structural information has limited our understanding of their functional dynamics. Here, I report the folding dynamics for the TCV TSS using optical tweezers (OT), a single molecule technique. My study of the unfolding/folding pathways for the TCV TSS has provided an unexpected unfolding pathway, confirmed the presence of Ψ3 and hairpin elements, and suggested an interconnection between the hairpins and pseudoknots. In addition, this study has demonstrated the importance of the adjacent upstream adenylate-rich sequence for the formation of H4a/Ψ3 along with the contribution of magnesium to the stability of the TCV TSS. In my second project, I report on the structural analysis of the PEMV kl-TSS using NMR and SAXS. This study has re-confirmed the base-pair pattern for the PEMV kl-TSS and the proposed interaction of the PEMV kl-TSS with its interacting partner, hairpin 5H2. The molecular envelope of the kl-TSS built from SAXS analysis suggests the kl-TSS has two functional conformations, one of which has a different shape from the previously predicted tRNA-shaped form. Along with applying biophysical methods to study the structural folding dynamics of RNAs, I have also developed a technique that improves the production of large quantities of recombinant RNAs in vivo for NMR study. In this project, I report using the wild-type and mutant E.coli strains to produce cost-effective, site-specific labeled, recombinant RNAs. This technique was validated with four representative RNAs of different sizes and complexity to produce milligram amounts of RNAs. The benefit of using site-specific labeled RNAs made from E.coli was demonstrated with several NMR techniques.
RNA is an underutilized target for drug discovery. Once thought to be a passive carrier of genetic information, RNA is now known to play a critical role in essentially all aspects of biology including signaling, gene regulation, catalysis, and retroviral infection. It is now well-established that RNA does not exist as a single static structure, but instead populates an ensemble of energetic minima along a free-energy landscape. Knowledge of this structural landscape has become an important goal for understanding its diverse biological functions. In this case, NMR spectroscopy has emerged as an important player in the characterization of RNA structural ensembles, with solution-state techniques accounting for almost half of deposited RNA structures in the PDB, yet the rate of RNA structure publication has been stagnant over the past decade. Several bottlenecks limit the pace of RNA structure determination by NMR: the high cost of isotopic labeling, tedious and ambiguous resonance assignment methods, and a limited database of RNA optimized pulse programs. We have addressed some of these challenges to NMR characterization of RNA structure with applications to various RNA-drug targets. These approaches will increasingly become integral to designing new therapeutics targeting RNA.