5 resultados para GENOMIC SEQUENCES
em Universitat de Girona, Spain
Resumo:
The statistical analysis of literary style is the part of stylometry that compares measurable characteristics in a text that are rarely controlled by the author, with those in other texts. When the goal is to settle authorship questions, these characteristics should relate to the author’s style and not to the genre, epoch or editor, and they should be such that their variation between authors is larger than the variation within comparable texts from the same author. For an overview of the literature on stylometry and some of the techniques involved, see for example Mosteller and Wallace (1964, 82), Herdan (1964), Morton (1978), Holmes (1985), Oakes (1998) or Lebart, Salem and Berry (1998). Tirant lo Blanc, a chivalry book, is the main work in catalan literature and it was hailed to be “the best book of its kind in the world” by Cervantes in Don Quixote. Considered by writters like Vargas Llosa or Damaso Alonso to be the first modern novel in Europe, it has been translated several times into Spanish, Italian and French, with modern English translations by Rosenthal (1996) and La Fontaine (1993). The main body of this book was written between 1460 and 1465, but it was not printed until 1490. There is an intense and long lasting debate around its authorship sprouting from its first edition, where its introduction states that the whole book is the work of Martorell (1413?-1468), while at the end it is stated that the last one fourth of the book is by Galba (?-1490), after the death of Martorell. Some of the authors that support the theory of single authorship are Riquer (1990), Chiner (1993) and Badia (1993), while some of those supporting the double authorship are Riquer (1947), Coromines (1956) and Ferrando (1995). For an overview of this debate, see Riquer (1990). Neither of the two candidate authors left any text comparable to the one under study, and therefore discriminant analysis can not be used to help classify chapters by author. By using sample texts encompassing about ten percent of the book, and looking at word length and at the use of 44 conjunctions, prepositions and articles, Ginebra and Cabos (1998) detect heterogeneities that might indicate the existence of two authors. By analyzing the diversity of the vocabulary, Riba and Ginebra (2000) estimates that stylistic boundary to be near chapter 383. Following the lead of the extensive literature, this paper looks into word length, the use of the most frequent words and into the use of vowels in each chapter of the book. Given that the features selected are categorical, that leads to three contingency tables of ordered rows and therefore to three sequences of multinomial observations. Section 2 explores these sequences graphically, observing a clear shift in their distribution. Section 3 describes the problem of the estimation of a suden change-point in those sequences, in the following sections we propose various ways to estimate change-points in multinomial sequences; the method in section 4 involves fitting models for polytomous data, the one in Section 5 fits gamma models onto the sequence of Chi-square distances between each row profiles and the average profile, the one in Section 6 fits models onto the sequence of values taken by the first component of the correspondence analysis as well as onto sequences of other summary measures like the average word length. In Section 7 we fit models onto the marginal binomial sequences to identify the features that distinguish the chapters before and after that boundary. Most methods rely heavily on the use of generalized linear models
Resumo:
Detecting changes between images of the same scene taken at different times is of great interest for monitoring and understanding the environment. It is widely used for on-land application but suffers from different constraints. Unfortunately, Change detection algorithms require highly accurate geometric and photometric registration. This requirement has precluded their use in underwater imagery in the past. In this paper, the change detection techniques available nowadays for on-land application were analyzed and a method to automatically detect the changes in sequences of underwater images is proposed. Target application scenarios are habitat restoration sites, or area monitoring after sudden impacts from hurricanes or ship groundings. The method is based on the creation of a 3D terrain model from one image sequence over an area of interest. This model allows for synthesizing textured views that correspond to the same viewpoints of a second image sequence. The generated views are photometrically matched and corrected against the corresponding frames from the second sequence. Standard change detection techniques are then applied to find areas of difference. Additionally, the paper shows that it is possible to detect false positives, resulting from non-rigid objects, by applying the same change detection method to the first sequence exclusively. The developed method was able to correctly find the changes between two challenging sequences of images from a coral reef taken one year apart and acquired with two different cameras
Resumo:
Realistic rendering animation is known to be an expensive processing task when physically-based global illumination methods are used in order to improve illumination details. This paper presents an acceleration technique to compute animations in radiosity environments. The technique is based on an interpolated approach that exploits temporal coherence in radiosity. A fast global Monte Carlo pre-processing step is introduced to the whole computation of the animated sequence to select important frames. These are fully computed and used as a base for the interpolation of all the sequence. The approach is completely view-independent. Once the illumination is computed, it can be visualized by any animated camera. Results present significant high speed-ups showing that the technique could be an interesting alternative to deterministic methods for computing non-interactive radiosity animations for moderately complex scenarios
Resumo:
El virus de l'hepatitis C (VHC) provoca una hepatitis crònica que afecta a més de 170 milions de persones d'arreu del món. És un virus petit que es classifica dins de la família Flaviviridae i és un virus d'RNA de cadena positiva amb un genoma d'aproximadament 9.600 nucleòtids. A l'extrem 5' del genoma viral s'hi troba una regió no codificant (5'NCR) que comprèn els primers 341 nucleòtids i la seva funció està relaciona amb la traducció. Immediatament després hi ha una pauta de lectura oberta ORF que acaba en un únic codó d'aturada i codifica una poliproteïna de 3.010 aminoàcids. A continuació l'extrem 3' no codificant (3'NCR), que malgrat es desconeixen les seves funcions exactes, s'ha demostrat que és essencial per a la replicació vírica. La única poliproteïna generada és processada co- i postraduccionalment mitjançant proteases de l'hoste i víriques, donant lloc a les proteïnes estructurals (Core, E1 i E2-p7) i no estructurals (NS2-NS5B). Igual que la majoria de virus RNA, el VHC es caracteritza per tenir una taxa de mutació elevada. De fet, el genoma del virus no es pot definir com una única seqüència sinó per una població de variants molt relacionades entre sí. A aquesta manera d'organitzar la informació genètica se l'anomena quasiespècie viral i una de les seves implicacions principals és la facilitat amb què sorgeixen resistents al tractament. Els tractaments disponibles són llargs, cars, provoquen efectes secundaris considerables i només es resolen completament el 40% dels casos. Per aquesta raó es busquen altres solucions terapèutiques per combatre el virus entre les quals s'hi inclouen diferents estratègies. Una de les més innovadores i prometedores és la utilització de ribozims dirigits directament contra el genoma del virus. Aquest treball es centra en l'estudi de les noves estratègies terapèutiques basades en ribozims, concretament la ribonucleasa P. La ribonucleasa P és un ribozim que està present en tots els organismes ja que és l'enzim responsable de la maduració dels precursors d'RNA de transferència. El més interessant a nivell terapèutic és que s'ha demostrat que es pot dirigir la seva activitat cap a qualsevol RNA utilitzant una seqüència guia d'RNA que quan hibrida amb l'RNA diana, l'híbrid imita l'estructura secundària del substrat natural. En el cas del VHC, s'han estudiat ribozims dependents de seqüència (ribozims derivats d'RNAs satèl·lits i de viroides de plantes), sempre dirigits contra la regió més conservada del virus per evitar una disminució de l'eficiència del ribozim deguda a la variació de la diana. La ribonucleasa P és una endonucleasa d'activitat molt específica i es diferencia dels altres ribozims naturals en el sistema de reconeixement del substrat, reconeix elements estructurals i no de seqüència. L'objectiu final del treball és tallar in vitro l'RNA del VHC aprofitant la propietat que presenta aquest ribozim de reconèixer elements estructurals i no de seqüència ja que per a un mateix nombre de seqüències, el nombre d'estructures viables que pot adoptar l'RNA genòmic és molt més petit i per tant la variabilitat de la diana disminueix. S'han estudiat dos models d'RNasa P, la RNasa P humana guiada per seqüència guia externa (EGS) i l'RNA M1 de l'RNasa P d'E.coli unit a la seqüència guia per l'extrem 3' (ribozim M1GS). Abans però de dirigir el ribozim, s'han estudiat l'estructura i la variabilitat d'una regió del genoma del virus ja que s'ha descrit que són factors que poden limitar l'eficiència de qualsevol ribozim. Derivat d'aquests estudis s'aporten dades sobre accessibilitat i variabilitat d'una regió interna del genoma del virus de l'hepatitis C, la zona d'unió de la regió E2/NS2 (regió 2658-2869). L'estudi d'accessibilitat revela que la regió 2658-2869 del genoma del virus conté dominis oberts i tancats i que la transició entre uns i altres no és brusca si es compara amb altres regions d'estructura coneguda (regió 5' no codificant). Els resultats dels assajos in vitro amb els dos models de RNasa P mostren que s'ha aconseguit dirigir tant la ribonucleasa P humana com el ribozim M1GS cap a una zona, predeterminada segons l'estudi d'accessibilitat, com a poc estructurada i tallar l'RNA del virus. De l'anàlisi de mutacions, però, es dedueix que la regió estudiada és variable. Tot i dirigir el ribozim cap a la zona més accessible, la variació de la diana podria afectar la interacció amb la seqüència guia i per tant disminuir l'eficiència de tall. Si es proposés una estratègia terapèutica consistiria en un atac simultani de vàries dianes.D'altra banda i derivat d'un resultat inesperat on s'ha observat en els experiments control que l'extracte de RNasa P humana tallava l'RNA viral en absència de seqüències guia externes, s'ha caracteritzat una nova interacció entre l'RNA del VHC i la RNasa P humana. Per a la identificació de l'enzim responsable dels talls s'han aplicat diferents tècniques que es poden dividir en mètodes directes (RNA fingerprinting) i indirectes (immunoprecipitació i inhibicions competitives). Els resultats demostren que la ribonucleasa P humana, i no un altre enzim contaminant de l'extracte purificat, és la responsable dels dos talls específics observats i que es localitzen, un a l'entrada interna al ribosoma (IRES) i molt a prop del codó AUG d'inici de la traducció i l'altre entre la regió codificant estructural i no estructural. La ribonucleasa P és un dels enzims del metabolisme del tRNA que s'utilitza per identificar estructures similars al tRNA en substrats diferents del substrat natural. Així doncs, el fet que la ribonucleasa P reconegui i talli el genoma del VHC en dues posicions determinades suggereix que, a les zones de tall, el virus conté estructures semblants al substrat natural, és a dir estructures tipus tRNA. A més, tot i que el VHC és molt variable, els resultats indiquen que aquestes estructures poden ser importants per el virus, ja que es mantenen en totes les variants naturals analitzades. Creiem que la seva presència podria permetre al genoma interaccionar amb factors cel·lulars que intervenen en la biologia del tRNA,particularment en el cas de l'estructura tipus tRNA que es localitza a l'element IRES. Independentment però de la seva funció, es converteixen en unes noves dianes terapèutiques per a la RNasa P. S'ha de replantejar però l'estratègia inicial ja que la similitud amb el tRNA les fa susceptibles a l'atac de la ribonucleasa P, directament, en absència de seqüències guia externes.
Resumo:
Els organismes responen a la temperatura i a molts altres estressos sintetitzant un grup de proteïnes anomenat proteïnes de xoc de calor (HSPs). En plantes les sHsps, d'entre 15 i 30 kDa formen el grup més abundant i divers, classificat en funció de la seva localització subcel.lular i homologia en: mitocondrials, cloroplàstiques, de reticle endoplasmàtic i citoplàsmiques de classe I i II. Les sHsps-CI s'ha descrit que s'indueixen per estrès tèrmic, hídric i oxidatiu (peròxid d'hidrògen, llum UV, ozó) i en resposta a algunes hormones. També s'expressen durant el desenvolupament, per exemple durant l'embriogènesi, on es creu que podrien tenir un paper protector de l'embrió enfront la dessecació. Tot i que hi ha abundants treballs que correlacionen la resistència a l'estrès i l'acumulació de sHsps-CI, els mecanismes moleculars d'aquesta activitat són poc conguts. Tot i això, per diverses sHsps-CI ha estat descrita una activitat xaperona in vitro i, més recentment, que la seva sobreexpressió augmenta la viabilitat de cèl.lules d'E.coli en condicions d'estrès tèrmic. L'estudi de l'acumulació de sHsps-CI en surera (Quercus suber) mitjançant immunodetecció en electroforesi bidimensional mostra uns patrons d'acumulació complexos i formats per dos grups d'espècies proteiques principals, a l'entorn dels 10 i 17 kDa respectivament, que mostren una inducció diferencial en funció del teixit i l'estrès. Mentre que les espècies proteiques de 17 kDa s'indueixen per temperatura però no per estrès oxidatiu, les de ca. 10 kDa ho fan per estrès oxidatiu i no per temperatura. Ambdós grups d'espècies proteiques s'acumulen conjuntament en fel.lema. Assajos de PCR i RT-PCR han permès clonar parcialment tres noves sHsps-CI en surera: Qshsp10-CI, QshspC-CI i QshspD-CI. Aquest fet confirma la multigeneïcitat de les sHsps-CI en surera que apuntava el patró bidimensional. Dels nous clons obtinguts destaca especialment Qshsp10-CI, un gen que presenta un codó stop enmig del domini -cristal.lí que fa que a la proteïna que se'n dedueix li manqui un 55% del domini -cristal.lí i tota l'extensió C-terminal. Es tractaria de la sHsp més petita i més truncada descrita fins al moment. L'anàlisi de l'expressió de Qshsp10-CI mitjançant RT-PCR mostra expressió en plantes tractades amb H2O2 però no en les que han estat sotmeses a un xoc de calor. Aprofitant l'oportunitat que oferia aquesta sHsp-CI de ser utilitzada com a model per l'estudi de la importància del domini -cristal.lí i l'extensió C-terminal en l'activitat protectora enfront l'estrès, es va voler determinar la capacitat que tenia d'augmentar la viabilitat de cèl.lules d'E. coli en condicions d'estrès tèrmic i oxidatiu. Els resultats mostren que la proteïna recombinant QsHsp10-CI, tot i la important truncació que té, és capaç de protegir cèl.lules d'E. coli en condicions d'estrès tèrmic i, remarcablement, en condicions d'estrès oxidatiu. Tots aquests resultats indiquen que les espècies proteiques de ca. 10 kDa podrien correspondre a Qshsp10-CI i tenir un paper en les cèl.lules del fel.lema en la protecció enfront l'estrès oxidatiu. L'estrès oxidatiu provoca lesions al DNA que poden produir errors en la replicació, transcripció o traducció i generar proteïnes aberrants. Donades les condicions d'estrès oxidatiu a les quals es troben sotmeses les cèl.lules del fel.lema, s'ha volgut estudiar la variabilitat dels seus àcids nucleics. La determinació de la taxa de mutació de la regió codificant del gen Qshsp17.4-CI en mRNA i DNA de fel.lema i àpex radicular, un teixit jove i en creixement actiu va mostrar unes taxes sorprenentment elevades en l'mRNA (1/1784 pb) i el DNA genòmic (1/1520 pb) del fel.lema. Aquestes taxes són les més altes descrites en un genoma nuclear eucariota i són similars a les dels virus d'RNA d'evolució ràpida com el virus de l'Hepatitis C. Amb aquestes taxes de mutació, un terç dels mRNAs del fel.lema de la surera contindrien missatges aberrants i la supervivència de les cel.lules es veuria compromesa. Això implica que el fel.lema hauria de ser considerat com un mosaic de cèl.lules genèticament heterogènies i, per tant, una sola seqüència no defineix en tota la seva amplitud un gen en aquest teixit. No es va detectar cap mutació en àpex de rel. Amb l'objectiu d'aprofundir en el coneixement de les mutacions que es donen en aquests dos teixits i per tal de poder fer una anàlisi qualitativa més completa que permetés especular sobre el seu origen, es va aplicar un mètode de selecció de seqüències mutants en base a la utilització d'enzims de restricció. Les mutacions detectades en fel.lema es corresponen amb les relacionades, en altres sistemes no nuclears (plasmidis, fags i DNA bacterià), amb l'estrès oxidatiu. En conseqüència, l'estrès oxidatiu al qual estan sotmeses les cèl.lules del fel.lema podria ser el causant de l'elevada taxa de mutació detectada. D'acord amb això, el tipus majoritari de productes d'oxidació de les bases del DNA que s'acumulen en brots de plàntules de surera en resposta al peròxid d'hidrògen produeixen el mateix tipus de mutacions detectades en l'mRNA del fel.lema de la surera. La major sensibilitat d'aquest nou mètode ha permès, a més, detectar mutacions en molècules d'mRNA de rel, un teixit en el qual no s'havia trobat cap mutació utilitzant el mètode de clonatge i seqüenciació directa. Tot i això, el tipus de mutacions predominants no estan relacionades amb l'estrès oxidatiu sinó amb erros en la reparació dels àcids nucleics.