Desenvolvimento e implementação de modelos para simulação de dados SNPs


Autoria(s): Utsunomiya, Adam Taiti Harth
Contribuinte(s)

Universidade Estadual Paulista (UNESP)

Data(s)

11/06/2014

11/06/2014

30/09/2010

Resumo

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)

Pós-graduação em Genética e Melhoramento Animal - FCAV

Um grande volume de informações de marcadores SNPs vem sendo produzidos e aplicados a metodologias de avaliação genética animal. A quantidade de informações disponíveis faz-se um desafio, pois armazená-las e processar-las é demandante computacionalmente. Então, propôs-se com este trabalho 2 algoritmos (MLOCO e MSNP) para simular dados SNPs como alternativa de minimizar a demanda por processamento e consumo de memória computacional. MLOCO simula SNP como um loco que possui configuração de alelos, posição no genoma e efeitos sobre a expressão de fenótipos (nulos para SNP). MSNP simula SNP apenas como loco que possui configuração de alelos e posição no genoma. Ao nível de cromossomo, para MLOCO, poligenes, QTLs e SNPs são armazenados em um único vetor de acordo com suas localizações. Para MSNP, poligenes, QTLs e SNPs também são armazenados de acordo com suas localizações, porém em vetores específicos para cada tipo de loco. Considerando o consumo de memória, MLOCO é menos eficiente porque armazena um número de variáveis maior (efeito do loco, mesmo que seja zero). MSNP não armazena esta variável. Quanto à velocidade de processamento, MLOCO é mais eficiente porque os locos são armazenados de maneira seqüencial, facilitando a amostragem dos alelos devido a variável “posição”, para formação de um gameta e consequentemente um indivíduo. Como o fator limitante na realização de simulações e utilizações de dados é a memória RAM, o MSNP é a melhor alternativa para simular dados SNPs

A large amount of information of SNPs markers have been produced and applied methodologies in genetic evaluation. The amount of information available makes it challenging, for storing and processing them is computationally expansive. So, it was proposed in this paper two algorithms (MLOCO and MSNP) to simulate data SNPs as an alternative to minimize the demand for processing and consumption of computer memory. MLOCO simulates SNP as a locus that has configuration of alleles, position in the genome and its effects on the expression phenotypes (null for SNP). MSNP SNP simulates only locus that has position and configuration of alleles. At the level of the chromosome to MLOCO, polygenes, QTLs and SNPs are stored in a single vector according to their locations. To MSNP, polygenes, QTLs and SNPs are also stored according to their locations, but in specific vectors for each locus type. Whereas the memory consumption, MLOCO is less efficient because stores a greater number of variables (locus effect, even if it is zero). MSNP does not store this variable. As for processing speed, MLOCO is more efficient because the loci are stored sequentially, facilitating the sampling of alleles due to the variable position to form a gamete and hence an individual. As the limiting factor in simulations and use data is the RAM memory, the MSNP is the best alternative for simulating SNPs data

Formato

iv, 64 f. : il.

Identificador

UTSUNOMIYA, Adam Taiti Harth. Desenvolvimento e implementação de modelos para simulação de dados SNPs. 2010. iv, 64 f. Dissertação (mestrado) - Universidade Estadual Paulista, Faculdade de Ciências Agrárias e Veterinárias, 2010.

http://hdl.handle.net/11449/92613

000638918

utsunomiya_ath_me_jabo.pdf

33004102030P4

Idioma(s)

por

Publicador

Universidade Estadual Paulista (UNESP)

Direitos

openAccess

Palavras-Chave #Simulação por computador #Software #Marcador molecular #Molecular marker #Simulation #Software
Tipo

info:eu-repo/semantics/masterThesis