6 resultados para archivio dati DNA

em AMS Tesi di Laurea - Alm@DL - Università di Bologna


Relevância:

100.00% 100.00%

Publicador:

Resumo:

La tesi riguarda l'utilizzo del DNA come archivio digitale; vengono mostrati i vantaggi di questo approccio concettuale, il metodo di codifica per ottenere le stringhe di DNA partendo da un generico file, l'efficienza del protocollo e i suoi costi.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

L'innovazione delle tecnologie di sequenziamento negli ultimi anni ha reso possibile la catalogazione delle varianti genetiche nei campioni umani, portando nuove scoperte e comprensioni nella ricerca medica, farmaceutica, dell'evoluzione e negli studi sulla popolazione. La quantità di sequenze prodotta è molto cospicua, e per giungere all'identificazione delle varianti sono necessari diversi stadi di elaborazione delle informazioni genetiche in cui, ad ogni passo, vengono generate ulteriori informazioni. Insieme a questa immensa accumulazione di dati, è nata la necessità da parte della comunità scientifica di organizzare i dati in repository, dapprima solo per condividere i risultati delle ricerche, poi per permettere studi statistici direttamente sui dati genetici. Gli studi su larga scala coinvolgono quantità di dati nell'ordine dei petabyte, il cui mantenimento continua a rappresentare una sfida per le infrastrutture. Per la varietà e la quantità di dati prodotti, i database giocano un ruolo di primaria importanza in questa sfida. Modelli e organizzazione dei dati in questo campo possono fare la differenza non soltanto per la scalabilità, ma anche e soprattutto per la predisposizione al data mining. Infatti, la memorizzazione di questi dati in file con formati quasi-standard, la dimensione di questi file, e i requisiti computazionali richiesti, rendono difficile la scrittura di software di analisi efficienti e scoraggiano studi su larga scala e su dati eterogenei. Prima di progettare il database si è perciò studiata l’evoluzione, negli ultimi vent’anni, dei formati quasi-standard per i flat file biologici, contenenti metadati eterogenei e sequenze nucleotidiche vere e proprie, con record privi di relazioni strutturali. Recentemente questa evoluzione è culminata nell’utilizzo dello standard XML, ma i flat file delimitati continuano a essere gli standard più supportati da tools e piattaforme online. È seguita poi un’analisi dell’organizzazione interna dei dati per i database biologici pubblici. Queste basi di dati contengono geni, varianti genetiche, strutture proteiche, ontologie fenotipiche, relazioni tra malattie e geni, relazioni tra farmaci e geni. Tra i database pubblici studiati rientrano OMIM, Entrez, KEGG, UniProt, GO. L'obiettivo principale nello studio e nella modellazione del database genetico è stato quello di strutturare i dati in modo da integrare insieme i dati eterogenei prodotti e rendere computazionalmente possibili i processi di data mining. La scelta di tecnologia Hadoop/MapReduce risulta in questo caso particolarmente incisiva, per la scalabilità garantita e per l’efficienza nelle analisi statistiche più complesse e parallele, come quelle riguardanti le varianti alleliche multi-locus.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Il documento presenta il caso dell'archivio fotografico della Fondazione Zeri come caso reale di conversione di un catalogo ricco di informazioni ma povero di interconnessioni nel dominio dei Linked Open Data, basandosi sull'ontologia CIDOC-CRM per il cultural heritage.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

L’obiettivo di questo lavoro di tesi è stato quindi quello di ricercare e archiviare tutti i dati sperimentali di correnti ioniche umane ventricolari presenti in letteratura fino ad oggi, per costruire uno strumento di facile utilizzo per chiunque abbia la necessità di sviluppare o validare modelli matematici di potenziale d’azione. Partendo da una fase iniziale di ricerca vera e propria degli articoli in letteratura, utilizzando il motore di ricerca PubMed come strumento principale, sono stati estratti e archiviati tutti i dati di interesse, divisi per tipo di corrente, memorizzando le informazioni principali in un foglio di lavoro e salvando i dati sia come immagini che come vettori, per consentirne in futuro una rapida consultazione e un facile utilizzo.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

La tesi si occupa dell'uso di più tecniche fotogrammetriche e di strumenti GIS nel recupero digitale e nell'integrazione di una molteplicità di dati storici, opportunamente georeferenziati, inerenti l'area del Centro Cadore, ai fini anche della valorizzazione turistico-culturale del territorio. Un ampio spazio viene dato alla caratterizzazione del territorio e delle fonti - cartografiche, fotografiche e testuali - che sono state recuperate ed organizzate in archivio. Le applicazioni fotogrammetriche comprendono la generazione di ortofoto digitali a scala territoriale da immagini storiche e modelli 3D close-range ottenuti con tecniche SfM.

Relevância:

30.00% 30.00%

Publicador:

Resumo:

L'analisi del DNA è una delle chiavi per la comprensione della vita e dei suoi funzionamenti. Le tecniche di sequenziamento di nuova generazione NGS permettono una analisi parallela di molte sequenze che hanno reso possibili i sequenziamenti di genomi interi e l'impiego di questi dati in una vasta gamma di studi. In questa tesi verranno descritte le principali tecniche di sequenziamento NGS. Per quanto riguarda il genoma umano si tratteranno alcune tematiche di studio di varianti affrontate dal gruppo 1000Genomes. Nella fase conclusiva si introdurranno definizioni di statistica utili nell'affrontare l'elaborazione dei dati. Inoltre vengono descritti alcuni strumenti che permettono di svolgere questo tipo di analisi.