949 resultados para Sequenziamento, Sanger, dideossi, NGS, 454, pyrosequencing
Resumo:
The introduction of Next Generation Sequencing (NGS) has revolutionised population genetics, providing studies of non-model species with unprecedented genomic coverage, allowing evolutionary biologists to address questions previously far beyond the reach of available resources. Furthermore, the simple mutation model of Single Nucleotide Polymorphisms (SNPs) permits cost-effective high-throughput genotyping in thousands of individuals simultaneously. Genomic resources are scarce for the Atlantic herring (Clupea harengus), a small pelagic species that sustains high revenue fisheries. This paper details the development of 578 SNPs using a combined NGS and high-throughput genotyping approach. Eight individuals covering the species distribution in the eastern Atlantic were bar-coded and multiplexed into a single cDNA library and sequenced using the 454 GS FLX platform. SNP discovery was performed by de novo sequence clustering and contig assembly, followed by the mapping of reads against consensus contig sequences. Selection of candidate SNPs for genotyping was conducted using an in silico approach. SNP validation and genotyping were performed simultaneously using an Illumina 1,536 GoldenGate assay. Although the conversion rate of candidate SNPs in the genotyping assay cannot be predicted in advance, this approach has the potential to maximise cost and time efficiencies by avoiding expensive and time-consuming laboratory stages of SNP validation. Additionally, the in silico approach leads to lower ascertainment bias in the resulting SNP panel as marker selection is based only on the ability to design primers and the predicted presence of intron-exon boundaries. Consequently SNPs with a wider spectrum of minor allele frequencies (MAFs) will be genotyped in the final panel. The genomic resources presented here represent a valuable multi-purpose resource for developing informative marker panels for population discrimination, microarray development and for population genomic studies in the wild.
Resumo:
The growing accessibility to genomic resources using next-generation sequencing (NGS) technologies has revolutionized the application of molecular genetic tools to ecology and evolutionary studies in non-model organisms. Here we present the case study of the European hake (Merluccius merluccius), one of the most important demersal resources of European fisheries. Two sequencing platforms, the Roche 454 FLX (454) and the Illumina Genome Analyzer (GAII), were used for Single Nucleotide Polymorphisms (SNPs) discovery in the hake muscle transcriptome. De novo transcriptome assembly into unique contigs, annotation, and in silico SNP detection were carried out in parallel for 454 and GAII sequence data. High-throughput genotyping using the Illumina GoldenGate assay was performed for validating 1,536 putative SNPs. Validation results were analysed to compare the performances of 454 and GAII methods and to evaluate the role of several variables (e.g. sequencing depth, intron-exon structure, sequence quality and annotation). Despite well-known differences in sequence length and throughput, the two approaches showed similar assay conversion rates (approximately 43%) and percentages of polymorphic loci (67.5% and 63.3% for GAII and 454, respectively). Both NGS platforms therefore demonstrated to be suitable for large scale identification of SNPs in transcribed regions of non-model species, although the lack of a reference genome profoundly affects the genotyping success rate. The overall efficiency, however, can be improved using strict quality and filtering criteria for SNP selection (sequence quality, intron-exon structure, target region score).
Resumo:
Routine molecular diagnostics modalities are unable to confidently detect low frequency mutations (<5-15%) that may indicate response to targeted therapies. We confirm the presence of a low frequency NRAS mutation in a rectal cancer patient using massively parallel sequencing when previous Sanger sequencing results proved negative and Q-PCR testing inconclusive. There is increasing evidence that these low frequency mutations may confer resistance to anti-EGFR therapy. In view of negative/inconclusive Sanger sequencing and Q-PCR results for NRAS mutations in a KRAS wt rectal case, the diagnostic biopsy and 4 distinct subpopulations of cells in the resection specimen after conventional chemo/radiotherapy were massively parallel sequenced using the Ion Torrent PGM. DNA was derived from FFPE rectal cancer tissue and amplicons produced using the Cancer Hotspot Panel V2 and sequenced using semiconductor technology. NRAS mutations were observed at varying frequencies in the patient biopsy (12.2%) and all four subpopulations of cells in the resection with an average frequency of 7.3% (lowest 2.6%). The results of the NGS also provided the mutational status of 49 other genes that may have prognostic or predictive value, including KRAS and PIK3CA. NGS technology has been postulated in diagnostics because of its capability to generate results in large panels of clinically meaningful genes in a cost-effective manner. This case illustrates another potential advantage of this technology: its use for detecting low frequency mutations that may influence therapeutic decisions in cancer treatment.
Resumo:
O conhecimento de mecanismos de genómica funcional tem sido maioritariamente adquirido pela utilização de organismos modelo que são mantidos em condições laboratoriais. Contudo, estes organismos não reflectem as respostas a alterações ambientais. Por outro lado, várias espécies, ecologicamente bem estudadas, reflectem bem as interacções entre genes e ambiente mas que, das quais não existem recursos genéticos disponíveis. O imposex, caracterizado pela superimposição de caracteres sexuais masculinos em fêmeas, é induzido pelo tributilestanho (TBT) e trifenilestanho (TPT) e representa um dos melhores exemplos de disrupção endócrina com causas antropogénicas no ambiente aquático. Com o intuito de elucidar as bases moleculares deste fenómeno, procedeu-se à combinação das metodologias de pirosequenciação (sequenciação 454 da Roche) e microarrays (Agilent 4*180K) de forma a contribuir para um melhor conhecimento desta interacção gene-ambiente no gastrópode Nucella lapillus, uma espécie sentinela para imposex. O trancriptoma de N. lapillus foi sequenciado, reconstruído e anotado e posteriormente utilizado para a produção de um “array” de nucleótidos. Este array foi então utilizado para explorar níveis de expressão génica em resposta à contaminação por TBT. Os resultados obtidos confirmaram as hipóteses anteriormente propostas (esteróidica, neuroendócrina, retinóica) e adicionalmente revelou a existência de potenciais novos mecanismos envolvidos no fenómeno imposex. Evidência para alvos moleculares de disrupção endócrina não relacionados com funções reprodutoras, tais como, sistema imunitário, apoptose e supressores de tumores, foram identificados. Apesar disso, tendo em conta a forte componente reprodutiva do imposex, esta componente funcional foi a mais explorada. Assim, factores de transcrição e receptores nucleares lipofílicos, funções mitocondriais e actividade de transporte celular envolvidos na diferenciação de géneros estão na base de potenciais novos mecanismos associados ao imposex em N. lapillus. Em particular, foi identificado como estando sobre-expresso, um possível homólogo do receptor nuclear “peroxisome proliferator-activated receptor gamma” (PPARγ), cuja função na indução de imposex foi confirmada experimentalmente in vivo após injecção dos animais com Rosiglitazone, um conhecido ligando de PPARγ em vertebrados. De uma forma geral, os resultados obtidos mostram que o fenómeno imposex é um mecanismo complexo, que possivelmente envolve a cascata de sinalização envolvendo o receptor retinoid X (RXR):PPARγ “heterodimer” que, até à data não foi descrito em invertebrados. Adicionalmente, os resultados obtidos apontam para alguma conservação de mecanismos de acção envolvidos na disrupção endócrina em invertebrados e vertebrados. Finalmente, a informação molecular produzida e as ferramentas moleculares desenvolvidas contribuem de forma significativa para um melhor conhecimento do fenómeno imposex e constituem importantes recursos para a continuação da investigação deste fenómeno e, adicionalmente, poderão vir a ser aplicadas no estudo de outras respostas a alterações ambientais usando N. lapillus como organismo modelo. Neste sentido, N. lapillus foi também utilizada para explorar a adaptação na morfologia da concha em resposta a alterações naturais induzidas por acção das ondas e pelo risco de predação por caranguejos. O contributo da componente genética, plástica e da sua interacção para a expressão fenotípica é crucial para compreender a evolução de caracteres adaptativos a ambientes heterogéneos. A contribuição destes factores na morfologia da concha de N. lapillus foi explorada recorrendo a transplantes recíprocos e experiências laboratoriais em ambiente comum (com e sem influência de predação) e complementada com análises genéticas, utilizando juvenis provenientes de locais representativos de costas expostas e abrigadas da acção das ondas. As populações estudadas são diferentes geneticamente mas possuem o mesmo cariótipo. Adicionalmente, análises morfométricas revelaram plasticidade da morfologia da concha em ambas as direcções dos transplantes recíprocos e também a retenção parcial, em ambiente comum, da forma da concha nos indivíduos da F2, indicando uma correlação positiva (co-gradiente) entre heritabilidade e plasticidade. A presença de estímulos de predação por caranguejos estimulou a produção de conchas com labros mais grossos, de forma mais evidente em animais recolhidos de costas expostas e também provocou alterações na forma da concha em animais desta proveniência. Estes dados sugerem contra-gradiente em alterações provocadas por predação na morfologia da concha, na produção de labros mais grossos e em níveis de crescimento. O estudo das interacções gene-ambiente descritas acima demonstram a actual possibilidade de produzir recursos e conhecimento genómico numa espécie bem caracterizada ecologicamente mas com limitada informação genómica. Estes recursos permitem um maior conhecimento biológico desta espécie e abrirão novas oportunidades de investigação, que até aqui seriam impossíveis de abordar.
Resumo:
Next-generation sequencing (NGS) technologies have become the standard for data generation in studies of population genomics, as the 1000 Genomes Project (1000G). However, these techniques are known to be problematic when applied to highly polymorphic genomic regions, such as the human leukocyte antigen (HLA) genes. Because accurate genotype calls and allele frequency estimations are crucial to population genomics analyses, it is important to assess the reliability of NGS data. Here, we evaluate the reliability of genotype calls and allele frequency estimates of the single-nucleotide polymorphisms (SNPs) reported by 1000G (phase I) at five HLA genes (HLA-A, -B, -C, -DRB1, and -DQB1). We take advantage of the availability of HLA Sanger sequencing of 930 of the 1092 1000G samples and use this as a gold standard to benchmark the 1000G data. We document that 18.6% of SNP genotype calls in HLA genes are incorrect and that allele frequencies are estimated with an error greater than ±0.1 at approximately 25% of the SNPs in HLA genes. We found a bias toward overestimation of reference allele frequency for the 1000G data, indicating mapping bias is an important cause of error in frequency estimation in this dataset. We provide a list of sites that have poor allele frequency estimates and discuss the outcomes of including those sites in different kinds of analyses. Because the HLA region is the most polymorphic in the human genome, our results provide insights into the challenges of using of NGS data at other genomic regions of high diversity.
Resumo:
Thèse réalisée en cotutelle avec l'Université Pierre et Marie Curie, Paris 6(UPMC, Paris, France).
Resumo:
Les champignons mycorhiziens à arbuscules (CMA) sont des organismes microscopiques du sol qui jouent un rôle crucial dans les écosystèmes naturels et que l’on retrouve dans tous les habitats de la planète. Ils vivent en relation symbiotique avec la vaste majorité des plantes terrestres. Ils sont des biotrophes obligatoires, c'est-à-dire qu'ils ne peuvent croître qu'en présence d'une plante hôte. Cette symbiose permet entre autres à la plante d'acquérir des nutriments supplémentaires, en particulier du phosphore et du nitrate. Malgré le fait que cette symbiose apporte des services importants aux écosystèmes, la richesse des espèces, la structure des communautés, ainsi que la diversité fonctionnelle des CMA sont mal connues et l'approfondissement des connaissances dans ces domaines dépend d’outils de diagnostic moléculaire. Cependant, la présence de polymorphisme nucléaire intra-isolat combiné à un manque de données génomiques dans différents groupes phylogénétique de ces champignons complique le développement de marqueurs moléculaires et la détermination de l'affiliation évolutive à hauts niveaux de résolution (c.a.d. entre espèces génétiquement similaires et/ou isolats de la même espèce). . Pour ces raisons, il semble une bonne alternative d’utiliser un système génétique différent en ciblant le génome mitochondrial, qui a été démontré homogène au sein d'un même isolat de CMA. Cependant, étant donné le mode de vie particulier de ces organismes, une meilleure compréhension des processus évolutifs mitochondriaux est nécessaire afin de valoriser l'utilisation de tels marqueurs dans des études de diversité et en génétique des populations. En ce sens, mon projet de doctorat consistait à investiguerétudier: i) les vecteurs de divergences inter-isolats et -espèces génétiquement rapprochéesphylogénétiquement apparentées, ii) la plasticité des génomes mitochondriaux, iii) l'héritabilité mitochondriale et les mécanismes potentiels de ségrégation, ainsi que iv) la diversité mitochondriale intra-isolat in situ. À l'aide de la génomique mitochondriale comparative, en utilisant le séquençage nouvelle génération, on a démontré la présence de variation génétique substantielle inter-isolats et -espèces, engendrées par l'invasion d'éléments mobiles dans les génomes mitochondriaux des CMA, donnant lieu à une évolution moléculaire rapide des régions intergéniques. Cette variation permettait de développer des marqueurs spécifiques à des isolats de la même espèce. Ensuite, à l'aide d'une approche analytique par réseaux de gènes sur des éléments mobiles, on a été en mesure de démontrer des évènements de recombinaisons homologues entre des haplotypes mitochondriaux distincts, menant à des réarrangements génomiques. Cela a permis d'ouvrir les perspectives sur la dynamique mitochondriale et l'hétéroplasmie dans un même isolatsuggère une coexistence de différents haplotypes mitochondriaux dans les populations naturelles et que les cultures monosporales pourraient induirent une sous-estimation de la diversité allélique mitochondriale. Cette apparente contradiction avec l'homogénéité mitochondriale intra-isolat généralement observée, a amené à investiguer étudier les échanges génétiques à l'aide de croisements d'isolats génétiquement distincts. Malgré l'observation de quelques spores filles hétéroplasmiques, l'homoplasmie était le statut par défaut dans toutes les cultures monosporales, avec un biais en faveur de l'un des haplotypes parentaux. Ces résultats suggèrent que la ségrégation opère durant la formation de la spore et/ou le développement de la coloniedu mycélium. De plus, ils supportent la présence d'une machinerie protéique de ségrégation mitochondriale chez les CMAAMF, où l'ensemble des gènes impliqués dans ce mécanisme ont été retrouvé et sont orthologues aux autres champignons. Finalement, on est revenue aux sources avecon a étudié le polymorphisme mitochondrial intra-isolat à l'aide d'une approche conventionnelle de PCR en utilisant une Taq polymérase de haute fidélité, suivie de clonage et de séquençage Sanger, sur deux isolats de R. irregularis. Cela a permis l'observation d'hétéroplasmie in situ, ainsi que la co-expression de variantes de variantes de protéines'ARNm dans une souche in vitro. Les résultats suggèrent que d'autres études basées sur le séquençage nouvelle génération aurait potentiellement ignorée cette variation, offrant ainsi plusieurs nouveaux arguments permettant de considérer les CMA comme des organismes possédant une population de génomes mitochondriaux et nucléaires distincts.
Resumo:
La infertilidad afecta en la actualidad a aproximadamente 1 de cada 7 parejas a nivel mundial. La falla ovárica prematura (FOP) es una condición común en la población femenina, afectando al 1% de mujeres menores de 40 años. La etiología de la FOP es idiopática entre el 50% y el 80% de los casos, lo que sugiere causas genéticas, epigenéticas y ambientales aún desconocidas. A pesar de los avances en las técnicas de cartografía genética y de sistematización de la técnica de Sanger, pocos genes etiológicos de FOP fueron identificados en los últimos 20 años. Este fracaso relativo se asoció principalmente a que cientos de genes, que abarcan grandes regiones del genoma, son candidatos pero la técnica de secuenciación directa sólo permite el análisis de unas 700bp en cada reacción. En el presente trabajo se empleó la secuenciación de siguiente generación (NGS) para la búsqueda de mutaciones en 70 genes candidatos que potencialmente contribuyen con el desarrollo de la patología. Se identificaron mutaciones en 3 de 12 pacientes. La paciente POF-7 presentaba una mutación no sinónima en el gen ADAMTS19 (c.2828C>T, p.Thr943Ile). La proteína ADAMTS19 se clasifica dentro de la familia ADAMTS como huérfana ya que no se ha identificado su sustrato. Mediante el sistema de doble hibrido en levaduras se buscó identificar las potenciales proteínas que interactúan con ADAMTS19. Permitió identificar, a partir de las versiones murinas, la interacción de Adamts19 y Col6a2. Para comprobar la interacción entre las proteínas ADAMTS19 y COL6A2 humanas se empleó el sistema de doble hibrido en células eucariotas. Los hallazgos no permitieron replicar los resultados obtenidos previamente. En síntesis de identificó una mutación potencialmente causal de FOP en un gen nuevo y una muy probable interacción entre ADAMTS19 y COL6A2.
Resumo:
Con motivo del desarrollo del Plan de Extensión de la Enseñanza Media por toda la geografía nacional, se aportan datos acerca de la creación de 19 nuevos centros, de la inauguración de otros Institutos y Secciones Delegadas, y acerca de las obras de construcción de nuevos edificios y mejora o modernización de los existentes que dependen de la Dirección General de Enseñanza Media.