922 resultados para High-Throughput Nucleotide Sequencing
Resumo:
Eine der Hauptursachen für unerwünschte oder reduzierte Wirkungen von Medikamenten ist die Induktion von Enzymen und Transportern des Medikamentenstoffwechsels. Diese Induktion stellt ursprünglich eine physiologische Reaktion auf die Aufnahme von potentiell schädlichen Fremdstoffen aus der Umwelt dar und sichert so die Gesundheit und Fortpflanzungsfähigkeit von Lebewesen. Beim Menschen sowie anderen Säugetieren werden Fremdstoffe hauptsächlich von den nukleären Rezeptoren PXR und CAR in der Leber und im Dünndarm detektiert. Zu den Medikamenten, welche über PXR und CAR wirken, gehören unter anderem Antikonvulsiva, Statine, antiretrovirale Medikamente, Glucocorticoide sowie Antimykotika. Die durch Fremdstoffe aktivierten Transkriptionsfaktoren PXR und CAR steigern die Menge der Enzyme und Transporter des Fremdstoffmetabolismus. Hierzu zählen vor allem die Cytochrom P450-Enzyme (Cyp-Enzyme) mit breitem Substratspektrum oder der Transporter MDR1, welcher eine Vielzahl von Substraten über Membranen transportiert. Durch die Biotransformation werden die induzierenden, lipophilen Substanzen so modifiziert, dass sie leichter über den Urin oder die Galle ausgeschieden werden können. \r\nDie Dauer der Induktion sollte auf die Zeit der Fremdstoffexposition beschränkt sein, um Störungen des endogenen Stoffwechsels zu vermindern. In dieser Arbeit werden jedoch Hinweise auf dauerhafte und sogar generationsübergreifende Effekte von Medikamenten in Mäusen geliefert. Nachkommen von Müttern, welche bereits vor ihrer Verpaarung einmalig mit TCPOBOP, einem Liganden des murinen CAR, injiziert wurden, hatten eine ungefähr 100-fach gesteigerte Genexpression von Cyp2b10. Auch gab es Expressionsänderungen von Genen, deren Produkte eine Rolle im Lipidstoffwechsel sowie bei Immunkrankheiten spielen. Eine Hochdurchsatz-RNA-Sequenzierung der injizierten Elterngeneration ergab außerdem dauerhafte Expressionsveränderungen anderer Gene des Medikamentenstoffwechsels sowie von Genen mit Verbindung zum Energiemetabolismus. \r\nBerücksichtigt man die enge evolutionäre Verwandtschaft der nukleären Rezeptoren CAR und PXR, sind Langzeitveränderungen auch für PXR möglich und wurden im Verlauf dieser Arbeit ebenfalls untersucht. Eine Hochdurchsatz-Sequenzierung ergab für Mäuse, welche mit dem PXR-Aktivator PCN induziert wurden, dass selbst noch drei Monate nach der Exposition Gene verändert exprimiert waren, welche im Zusammenhang mit Lebernekrosen stehen. Bei Nachkommen von PCN-injizierten Müttern wurden Gene unterschiedlich exprimiert, welche eine Rolle bei der Energiehomöostase sowie im Glukosestoffwechsel spielen. Im Erwachsenenalter sind bei diesen Nachkommen darüber hinaus noch Gene unterschiedlich exprimiert, deren Produkte eine Funktion in der Immunantwort haben. \r\nDa Erwachsene aufgrund ihrer Lebensdauer sowie der absoluten Krankheitshäufigkeit wesentlich öfter Kontakt mit Fremdstoffen haben, war medizinisch von besonderem Interesse, ob anhaltende Genexpressionsänderungen auch bei Erwachsenen zu beobachten sind. So konnte im Rahmen dieser Arbeit gezeigt werden, dass auch einmalig exponierte Adulttiere Gene dauerhaft verändert exprimieren und die Veränderungen im Medikamentenstoffwechsel an die nächste Generation übertrugen. \r\n\r\nBisher sind klinische Studien zur Risikobewertung von Medikamenten (Pharmakovigilanz) nicht generationsübergreifend angelegt. Diese Arbeit gibt Anstöße dafür, dass dies in Zukunft für viel mehr Medikamente notwendig werden könnte. Neben Veränderungen im Medikamentenstoffwechsel ergeben sich Nebenwirkungen von PXR- und CAR-Liganden vor allem aus ihrer Beteiligung an endogenen Stoffwechselwegen. Nach Aktivierung von CAR, welcher viele metabolische Stoffwechselwege steuert, treten beispielsweise Störungen des Energiestoffwechsels auf. Ein tieferes Verständnis der Rezeptoraktivität von CAR samt einer gezielten Modulierung seiner Aktivität würde wichtige Beiträge zum Verständnis der Regulation des Fremdstoffmetabolismus sowie der Entstehung von Nebenwirkungen durch eine Behandlung mit CAR-Liganden leisten. Dauerhafte Veränderungen endogener Stoffwechselwege könnten dann möglicherweise über eine pharmakologische Modulierung der CAR-Aktivität reduziert werden. \r\nZu diesem Zweck wurden im Verlauf dieser Arbeit die CAR-Rezeptoren der Amphibien (Xenopus tropicalis, Xenopus laevis) und Reptilien (Anolis carolinensis) erstmals kloniert, als Proteine exprimiert und charakterisiert. Vergleiche zwischen Tierarten ermöglichen ein besseres Verständnis von humanen Proteinen. Funktionelle Analysen ergaben Ähnlichkeiten des Xenopus laevis-CAR mit dem PXR der Säugetiere: eine niedrige basale Aktivität sowie eine starke Induzierbarkeit durch Liganden. In weiteren funktionellen Analysen wurden die Determinanten der basalen Aktivität des Xenopus laevis-CAR untersucht. Die basale Aktivität war nicht abhängig von der subzellulären Lokalisation, sondern ergab sich aus der Proteinstruktur, welche nur beim CAR der Landvertebraten in einer aktiven Konformation fixiert ist. Ähnlich dem PXR der Säugetiere besitzt CAR der Amphibien eine Aktivierungsdomäne, welche erst durch Ligandenbindung in eine aktive Konformation gebracht wird. Mutationen einzelner Aminosäuren zum jeweils humanen Homolog erhöhten die basale Aktivität des Xenopus laevis-CAR auf die des humanen Rezeptors. Diese Mutanten mit erhöhter basalen Aktivität zeigten eine verstärkte Interaktion mit dem Kofaktor PGC-1a, einem Regulator des Energiestoffwechsels bei Säugetieren. Die hepatischen Zielgene des CAR der Amphibien überlappen zum Teil mit den humanen Zielgenen und spielen ebenfalls eine Rolle im Energiestoffwechsel.
Resumo:
Herzwirksame Glykoside sind in der Natur sowohl im Tier- als auch im Pflanzenreich zu finden und werden regelmäßig zur Therpaie von Herzinsuffizienz eingesetzt. In letzter Zeit belegten viele Studien, dass herzwirksame Glykoside vielversprechende Substanzen für die Behandlung von Krebs darstellen. Ihr Wirkmechanismus basiert auf der Hemmung der Na+/K+-ATPase. Die Na+/K+-ATPase spielt neuerdings eine wichtige Rolle in der Krebsbiologie, da sie viele relevante Signalwege beeinflusst. Multiresistenzen gegen Arzneimittel sind oftmals verantwortlich für das Scheitern einer Chemotherapie. Bei multi-drug-resistenten Tumoren erfolgt ein Transport der Chemotherapeutika aus der Krebszelle hinaus durch das Membranprotein P-Glykoprotein. In der vorliegenden Arbeit wurde die Zytotoxizität von 66 herzwirksamen Glykosiden und ihren Derivaten in sensitiven und resistenten Leukämie-Zellen getestet. Die Ergebnisse zeigen, dass diese Naturstoffe die Zell-Linien in verschiedenen molaren Bereichen abtöten. Allerdings waren die Resistenz-Indizes niedrig (d. h. die IC50 Werte waren in beiden Zell-Linien ähnlich). Die untersuchten 66 Substanzen besitzen eine große Vielfalt an chemischen Substituenten. Die Wirkung dieser Substituenten auf die Zytotoxizität wurde daher durch Struktur-Aktivitäts-Beziehung (SAR) erforscht. Des Weiteren wiesen quantitative Struktur-Aktivitäts-Beziehung (QSAR) und molekulares Docking darauf hin, dass die Na+/K+-ATPase in sensitiven und resistenten Zellen unterschiedlich stark exprimiert wird. Eine Herunterregulation der Na+/K+-ATPase in multi-drug-resistenten Zellen wurde durch Western Blot bestätigt und die Wirkung dieser auf relevante Signalwege durch Next-Generation-Sequenzierung weiter verfolgt. Dadurch konnte eine Verbindung zwischen der Überexpression von P-Glykoprotein und der Herunterregulation der Na+/K+-ATPase hergestellt werden. Der zweite Aspekt der Arbeit war die Hemmung von P-Glykoprotein durch herzwirksame Glykoside, welche durch Hochdurchsatz-Durchflusszytometrie getestet wurde. Sechs wirksame Glykoside konnten den P-Glykoprotein-vermittelten Transport von Doxorubicin inhibieren. Zudem konnte die Zytotoxität von Doxorubicin in multi-drug-resistenten Zellen teilweise wieder zurück erlangt werden. Unabhängig von herzwirksamen Glykosiden war die Bewertung der Anwendung von molekularem Docking in der P-Glykoprotein Forschung ein weiterer Aspekt der Arbeit. Es ließ sich schlussfolgern, dass molekulares Docking fähig ist, zwischen den verschiedenen Molekülen zu unterscheiden, die mit P-Glykoprotein interagieren. Die Anwendbarkeit von molekularem Docking in Bezug auf die Bestimmung der Bindestelle einer Substanz wurde ebenfalls untersucht.
Resumo:
Mesenchymale Stamzellen (MSC) sind Vertreter der adulten Stammzellen. Sie bergen durch ihre große Plastizität ein immenses Potential für die klinische Nutzung in Form von Stammzelltherapien. Zellen dieses Typs kommen vornehmlich im Knochenmark der großen Röhrenknochen vor und können zu Knochen, Knorpel und Fettzellen differenzieren. MSC leisten einen wichtigen Beitrag im Rahmen regenerativer Prozesse, beispielsweise zur Heilung von Frakturen. Breite Studien demonstrieren bereits jetzt auch bei komplexeren Erkrankungen (z.B. Osteoporose) therapeutisch vielversprechende Einsatzmöglichkeiten. Oft kommen hierbei aus MSC gezielt differenzierte Folgelinien aus Zellkulturen zum Einsatz. Dies bedingt eine kontrollierte Steuerung der Differenzierungsprozesse in vitro. Der Differenzierung einer Stammzelle liegt eine komplexe Veränderung ihrer Genexpression zugrunde. Genexpressionsmuster zur Erhaltung und Proliferation der Stammzellen müssen durch solche, die der linienspezifischen Differenzierung dienen, ersetzt werden. Die mit der Differenzierung einhergehende, transkriptomische Neuausrichtung ist für das Verständnis der Prozesse grundlegend und wurde bislang nur unzureichend untersucht. Ziel der vorliegenden Arbeit ist eine transkriptomweite und vergleichende Genexpressionsanalyse Mesenchymaler Stammzellen und deren in vitro differenzierten Folgelinien mittels Plasmid - DNA Microarrays und Sequenziertechniken der nächsten Generation (RNA-Seq, Illumina Plattform). In dieser Arbeit diente das Hausrind (Bos taurus) als Modellorganismus, da es genetisch betrachtet eine hohe Ähnlichkeit zum Menschen aufweist und Knochenmark als Quelle von MSC gut verfügbar ist. Primärkulturen Mesenchymaler Stammzellen konnten aus dem Knochenmark von Rindern erfolgreich isoliert werden. Es wurden in vitro Zellkultur - Versuche durchgeführt, um die Zellen zu Osteoblasten, Chondrozyten und Adipozyten zu differenzieren. Zur Genexpressionsanalyse wurde RNA aus jungen MSC und einer MSC Langzeitkultur („alte MSC“), sowie aus den differenzierten Zelllinien isoliert und für nachfolgende Experimente wo nötig amplifiziert. Der Erfolg der Differenzierungen konnte anhand der Genexpression von spezifischen Markergenen und mittels histologischer Färbungen belegt werden. Hierbei zeigte sich die Differenzierung zu Osteoblasten und Adipozyten erfolgreich, während die Differenzierung zu Chondrozyten trotz diverser Modifikationen am Protokoll nicht erfolgreich durchgeführt werden konnte. Eine vergleichende Hybridisierung zur Bestimmung differentieller Genexpression (MSC vs. Differenzierung) mittels selbst hergestellter Plasmid - DNA Microarrays ergab für die Osteogenese mit Genen wie destrin und enpp1, für die undifferenzierten MSC mit dem Gen sema3c neue Kandidatengene, deren biologische Funktion aufzuklären in zukünftigen Experimenten vielversprechende Ergebnisse liefern sollte. Die Analyse der transkriptomweiten Genexpression mittels NGS lieferte einen noch umfangreicheren Einblick ins Differenzierungsgeschehen. Es zeigte sich eine hohe Ähnlichkeit im Expressionsprofil von jungen MSC und Adipozyten, sowie zwischen den Profilen der alten MSC (eine Langzeitkultur) und Osteoblasten. Die alten MSC wiesen deutliche Anzeichen für eine spontane Differenzierung in die osteogene Richtung auf. Durch Analyse der 100 am stärksten exprimierten Gene jeder Zelllinie ließen sich für junge MSC und Adipozyten besonders Gene der extrazellulären Matrix (z.B col1a1,6 ; fn1 uvm.) auffinden. Sowohl Osteoblasten, als auch die alten MSC exprimieren hingegen verstärkt Gene mit Bezug zur oxidativen Phosphorylierung, sowie ribosomale Proteine. Eine Betrachtung der differentiellen Genexpression (junge MSC vs. Differenzierung) mit anschließender Pathway Analyse und Genontologie Anreicherungsstatistik unterstützt diese Ergebnisse vor allem bei Osteoblasten, wo nun jedoch zusätzlich auch Gene zur Regulation der Knochenentwicklung und Mineralisierung in den Vordergrund treten. Für Adipozyten konnte mit Genen des „Jak-STAT signaling pathway“, der Fokalen Adhäsion, sowie Genen des „Cytokine-cytokine receptor interaction pathway“ sehr spannende Einsichten in die Biologie dieses Zelltyps erlangt werden, die sicher weiterer Untersuchungen bedürfen. In undifferenzierten MSC konnte durch differentielle Genexpressionsanalyse die Rolle des nicht kanonischen Teils des WNT Signalweges als für die Aufrechterhaltung des Stammzellstatus potentiell äußerst einflussreich ermittelt werden. Die hier diskutierten Ergebnisse zeigen beispielhaft, dass besonders mittels Genexpressionsanalyse im Hochdurchsatzverfahren wertvolle Einblicke in die komplexe Biologie der Stammzelldifferenzierung möglich sind. Als Grundlage für nachfolgende Arbeiten konnten interessante Gene ermittelt und Hypothesen zu deren Einfluss auf Stammzelleigenschaften und Differenzierungsprozesse aufgestellt werden. Um einen besseren Einblick in den Differenzierungsverlauf zu ermöglichen, könnten künftig NGS Analysen zu unterschiedlichen Differenzierungszeitpunkten durchgeführt werden. Zudem wären weitere Anstrengungen zur erfolgreichen Etablierung der chondrogenen Differenzierung zur vollständigen Analyse der Genexpression des trilinearen Differenzierungspotentials von MSC wünschenswert.
Resumo:
A growing world population, changing climate and limiting fossil fuels will provide new pressures on human production of food, medicine, fuels and feed stock in the twenty-first century. Enhanced crop production promises to ameliorate these pressures. Crops can be bred for increased yields of calories, starch, nutrients, natural medicinal compounds, and other important products. Enhanced resistance to biotic and abiotic stresses can be introduced, toxins removed, and industrial qualities such as fibre strength and biofuel per mass can be increased. Induced and natural mutations provide a powerful method for the generation of heritable enhanced traits. While mainly exploited in forward, phenotype driven, approaches, the rapid accumulation of plant genomic sequence information and hypotheses regarding gene function allows the use of mutations in reverse genetic approaches to identify lesions in specific target genes. Such gene-driven approaches promise to speed up the process of creating novel phenotypes, and can enable the generation of phenotypes unobtainable by traditional forward methods. TILLING (Targeting Induced Local Lesions IN Genome) is a high-throughput and low cost reverse genetic method for the discovery of induced mutations. The method has been modified for the identification of natural nucleotide polymorphisms, a process called Ecotilling. The methods are general and have been applied to many species, including a variety of different crops. In this chapter the current status of the TILLING and Ecotilling methods and provide an overview of progress in applying these methods to different plant species, with a focus on work related to food production for developing nations.
Resumo:
BACKGROUND: Production of native antigens for serodiagnosis of helminthic infections is laborious and hampered by batch-to-batch variation. For serodiagnosis of echinococcosis, especially cystic disease, most screening tests rely on crude or purified Echinococcus granulosus hydatid cyst fluid. To resolve limitations associated with native antigens in serological tests, the use of standardized and highly pure antigens produced by chemical synthesis offers considerable advantages, provided appropriate diagnostic sensitivity and specificity is achieved. METHODOLOGY/PRINCIPAL FINDINGS: Making use of the growing collection of genomic and proteomic data, we applied a set of bioinformatic selection criteria to a collection of protein sequences including conceptually translated nucleotide sequence data of two related tapeworms, Echinococcus multilocularis and Echinococcus granulosus. Our approach targeted alpha-helical coiled-coils and intrinsically unstructured regions of parasite proteins potentially exposed to the host immune system. From 6 proteins of E. multilocularis and 5 proteins of E. granulosus, 45 peptides between 24 and 30 amino acids in length were designed. These peptides were chemically synthesized, spotted on microarrays and screened for reactivity with sera from infected humans. Peptides reacting above the cut-off were validated in enzyme-linked immunosorbent assays (ELISA). Peptides identified failed to differentiate between E. multilocularis and E. granulosus infection. The peptide performing best reached 57% sensitivity and 94% specificity. This candidate derived from Echinococcus multilocularis antigen B8/1 and showed strong reactivity to sera from patients infected either with E. multilocularis or E. granulosus. CONCLUSIONS/SIGNIFICANCE: This study provides proof of principle for the discovery of diagnostically relevant peptides by bioinformatic selection complemented with screening on a high-throughput microarray platform. Our data showed that a single peptide cannot provide sufficient diagnostic sensitivity whereas pooling several peptide antigens improved sensitivity; thus combinations of several peptides may lead the way to new diagnostic tests that replace, or at least complement conventional immunodiagnosis of echinococcosis. Our strategy could prove useful for diagnostic developments in other pathogens.
Resumo:
A novel non-culture based 16S rRNA Terminal Restriction Fragment Length Polymorphism (T-RFLP) method using the restriction enzymes Tsp509I and Hpy166II was developed for the characterization of the nasopharyngeal microbiota and validated using recently published 454 pyrosequencing data. 16S rRNA gene T-RFLP for 153 clinical nasopharyngeal samples from infants with acute otitis media (AOM) revealed 5 Tsp509I and 6 Hpy166II terminal fragments (TFs) with a prevalence of >10%. Cloning and sequencing identified all TFs with a prevalence >6% allowing a sufficient description of bacterial community changes for the most important bacterial taxa. The conjugated 7-valent pneumococcal polysaccharide vaccine (PCV-7) and prior antibiotic exposure had significant effects on the bacterial composition in an additive main effects and multiplicative interaction model (AMMI) in concordance with the 16S rRNA 454 pyrosequencing data. In addition, the presented T-RFLP method is able to discriminate S. pneumoniae from other members of the Mitis group of streptococci, which therefore allows the identification of one of the most important human respiratory tract pathogens. This is usually not achieved by current high throughput sequencing protocols. In conclusion, the presented 16S rRNA gene T-RFLP method is a highly robust, easy to handle and a cheap alternative to the computationally demanding next-generation sequencing analysis. In case a lot of nasopharyngeal samples have to be characterized, it is suggested to first perform 16S rRNA T-RFLP and only use next generation sequencing if the T-RFLP nasopharyngeal patterns differ or show unknown TFs.
Resumo:
With the advent of high through-put sequencing (HTS), the emerging science of metagenomics is transforming our understanding of the relationships of microbial communities with their environments. While metagenomics aims to catalogue the genes present in a sample through assessing which genes are actively expressed, metatranscriptomics can provide a mechanistic understanding of community inter-relationships. To achieve these goals, several challenges need to be addressed from sample preparation to sequence processing, statistical analysis and functional annotation. Here we use an inbred non-obese diabetic (NOD) mouse model in which germ-free animals were colonized with a defined mixture of eight commensal bacteria, to explore methods of RNA extraction and to develop a pipeline for the generation and analysis of metatranscriptomic data. Applying the Illumina HTS platform, we sequenced 12 NOD cecal samples prepared using multiple RNA-extraction protocols. The absence of a complete set of reference genomes necessitated a peptide-based search strategy. Up to 16% of sequence reads could be matched to a known bacterial gene. Phylogenetic analysis of the mapped ORFs revealed a distribution consistent with ribosomal RNA, the majority from Bacteroides or Clostridium species. To place these HTS data within a systems context, we mapped the relative abundance of corresponding Escherichia coli homologs onto metabolic and protein-protein interaction networks. These maps identified bacterial processes with components that were well-represented in the datasets. In summary this study highlights the potential of exploiting the economy of HTS platforms for metatranscriptomics.
Resumo:
We describe a fast and unambiguous method for haplotyping the (TG)mTn repeat in IVS8 and determining three other single nucleotide polymorphisms (SNPs) in exons 10, 14a and 24 in the cystic fibrosis transmembrane conductance regulator (CFTR) gene affecting correct splicing of the CFTR pre-mRNA using primer extension and mass spectrometry. The diagnostic products are generated by primer extension (PEX) reactions, which require a single detection primer complementary to a region downstream of a target strand's variable site. On addition of a polymerase and an appropriate mixture of dNTP's and 2', 3'-dideoxynucleotide triphosphates (ddNTP's), the primer is extended through the mutation region until the first ddNTP is incorporated and the mass of the extension products determines the composition of the variable site. Analysis of patient DNA assigned the correct and unambiguous haplotype for the (TG)mTn repeat in intron 8 of the CFTR gene. Additional crucial SNPs influencing correct splicing in exon 10, 14 and 24 can easily be detected by biplexing the assay to genotype allelic variants important for correct splicing of the CFTR pre-mRNA. Different PEX reactions with subsequent mass spectrometry generate sufficient data, to enable unambiguous and easy haplotyping of the (TG)mTn repeat in the CFTR gene. The method can be easily extended to the inclusion of additional SNPs of interest by biplexing some of the PEX reactions. All experimental steps required for PEX are amenable to the high degree of automation desirable for a high-throughput diagnostic setting, facilitating the work of clinicians involved in the diagnosis of non-classic cystic fibrosis.
Resumo:
High-throughput SNP arrays provide estimates of genotypes for up to one million loci, often used in genome-wide association studies. While these estimates are typically very accurate, genotyping errors do occur, which can influence in particular the most extreme test statistics and p-values. Estimates for the genotype uncertainties are also available, although typically ignored. In this manuscript, we develop a framework to incorporate these genotype uncertainties in case-control studies for any genetic model. We verify that using the assumption of a “local alternative” in the score test is very reasonable for effect sizes typically seen in SNP association studies, and show that the power of the score test is simply a function of the correlation of the genotype probabilities with the true genotypes. We demonstrate that the power to detect a true association can be substantially increased for difficult to call genotypes, resulting in improved inference in association studies.
Resumo:
Background: The recent development of semi-automated techniques for staining and analyzing flow cytometry samples has presented new challenges. Quality control and quality assessment are critical when developing new high throughput technologies and their associated information services. Our experience suggests that significant bottlenecks remain in the development of high throughput flow cytometry methods for data analysis and display. Especially, data quality control and quality assessment are crucial steps in processing and analyzing high throughput flow cytometry data. Methods: We propose a variety of graphical exploratory data analytic tools for exploring ungated flow cytometry data. We have implemented a number of specialized functions and methods in the Bioconductor package rflowcyt. We demonstrate the use of these approaches by investigating two independent sets of high throughput flow cytometry data. Results: We found that graphical representations can reveal substantial non-biological differences in samples. Empirical Cumulative Distribution Function and summary scatterplots were especially useful in the rapid identification of problems not identified by manual review. Conclusions: Graphical exploratory data analytic tools are quick and useful means of assessing data quality. We propose that the described visualizations should be used as quality assessment tools and where possible, be used for quality control.
Resumo:
In most microarray technologies, a number of critical steps are required to convert raw intensity measurements into the data relied upon by data analysts, biologists and clinicians. These data manipulations, referred to as preprocessing, can influence the quality of the ultimate measurements. In the last few years, the high-throughput measurement of gene expression is the most popular application of microarray technology. For this application, various groups have demonstrated that the use of modern statistical methodology can substantially improve accuracy and precision of gene expression measurements, relative to ad-hoc procedures introduced by designers and manufacturers of the technology. Currently, other applications of microarrays are becoming more and more popular. In this paper we describe a preprocessing methodology for a technology designed for the identification of DNA sequence variants in specific genes or regions of the human genome that are associated with phenotypes of interest such as disease. In particular we describe methodology useful for preprocessing Affymetrix SNP chips and obtaining genotype calls with the preprocessed data. We demonstrate how our procedure improves existing approaches using data from three relatively large studies including one in which large number independent calls are available. Software implementing these ideas are avialble from the Bioconductor oligo package.
Resumo:
This thesis develops high performance real-time signal processing modules for direction of arrival (DOA) estimation for localization systems. It proposes highly parallel algorithms for performing subspace decomposition and polynomial rooting, which are otherwise traditionally implemented using sequential algorithms. The proposed algorithms address the emerging need for real-time localization for a wide range of applications. As the antenna array size increases, the complexity of signal processing algorithms increases, making it increasingly difficult to satisfy the real-time constraints. This thesis addresses real-time implementation by proposing parallel algorithms, that maintain considerable improvement over traditional algorithms, especially for systems with larger number of antenna array elements. Singular value decomposition (SVD) and polynomial rooting are two computationally complex steps and act as the bottleneck to achieving real-time performance. The proposed algorithms are suitable for implementation on field programmable gated arrays (FPGAs), single instruction multiple data (SIMD) hardware or application specific integrated chips (ASICs), which offer large number of processing elements that can be exploited for parallel processing. The designs proposed in this thesis are modular, easily expandable and easy to implement. Firstly, this thesis proposes a fast converging SVD algorithm. The proposed method reduces the number of iterations it takes to converge to correct singular values, thus achieving closer to real-time performance. A general algorithm and a modular system design are provided making it easy for designers to replicate and extend the design to larger matrix sizes. Moreover, the method is highly parallel, which can be exploited in various hardware platforms mentioned earlier. A fixed point implementation of proposed SVD algorithm is presented. The FPGA design is pipelined to the maximum extent to increase the maximum achievable frequency of operation. The system was developed with the objective of achieving high throughput. Various modern cores available in FPGAs were used to maximize the performance and details of these modules are presented in detail. Finally, a parallel polynomial rooting technique based on Newton’s method applicable exclusively to root-MUSIC polynomials is proposed. Unique characteristics of root-MUSIC polynomial’s complex dynamics were exploited to derive this polynomial rooting method. The technique exhibits parallelism and converges to the desired root within fixed number of iterations, making this suitable for polynomial rooting of large degree polynomials. We believe this is the first time that complex dynamics of root-MUSIC polynomial were analyzed to propose an algorithm. In all, the thesis addresses two major bottlenecks in a direction of arrival estimation system, by providing simple, high throughput, parallel algorithms.
Resumo:
Treponema paraluiscuniculi is the causative agent of rabbit venereal spirochetosis. It is not infectious to humans, although its genome structure is very closely related to other pathogenic Treponema species including Treponema pallidum subspecies pallidum, the etiological agent of syphilis. In this study, the genome sequence of Treponema paraluiscuniculi, strain Cuniculi A, was determined by a combination of several high-throughput sequencing strategies. Whereas the overall size (1,133,390 bp), arrangement, and gene content of the Cuniculi A genome closely resembled those of the T. pallidum genome, the T. paraluiscuniculi genome contained a markedly higher number of pseudogenes and gene fragments (51). In addition to pseudogenes, 33 divergent genes were also found in the T. paraluiscuniculi genome. A set of 32 (out of 84) affected genes encoded proteins of known or predicted function in the Nichols genome. These proteins included virulence factors, gene regulators and components of DNA repair and recombination. The majority (52 or 61.9%) of the Cuniculi A pseudogenes and divergent genes were of unknown function. Our results indicate that T. paraluiscuniculi has evolved from a T. pallidum-like ancestor and adapted to a specialized host-associated niche (rabbits) during loss of infectivity to humans. The genes that are inactivated or altered in T. paraluiscuniculi are candidates for virulence factors important in the infectivity and pathogenesis of T. pallidum subspecies.
Resumo:
Nonsyndromic cleft lip with or without cleft palate (NSCLP) is a common birth anomaly that requires prolonged multidisciplinary rehabilitation. Although variation in several genes has been identified as contributing to NSCLP, most of the genetic susceptibility loci have yet to be defined. To identify additional contributory genes, a high-throughput genomic scan was performed using the Illumina Linkage IVb Panel platform. We genotyped 6008 SNPs in nine non-Hispanic white NSCLP multiplex families and a single large African-American NSCLP multiplex family. Fourteen chromosomal regions were identified with LOD>1.5, including six regions not previously reported. Analysis of the data from the African-American and non-Hispanic white families revealed two likely chromosomal regions: 8q21.3-24.12 and 22q12.2-12.3 with LOD scores of 2.98 and 2.66, respectively. On the basis of biological function, syndecan 2 (SDC2) and growth differentiation factor 6 (GDF6) in 8q21.3-24.12 and myosin heavy-chain 9, non-muscle (MYH9) in 22q12.2-12.3 were selected as candidate genes. Association analyses from these genes yielded marginally significant P-values for SNPs in SDC2 and GDF6 (0.01