994 resultados para Dados estatísticos
Resumo:
O objetivo deste trabalho foi determinar a melhor alternativa, entre os métodos de agrupamento hierárquico (Ward) e de otimização (Tocher), para a formação de grupos homogêneos de séries de expressão gênica, e realizar previsões quanto à expressão gênica dessas séries, a partir de pequeno número de observações temporais. Os dados utilizados referem-se à expressão de genes que atuam sobre o ciclo celular de Saccharomyces cerevisiae e corresponderam a 114 séries de expressão gênica, cada uma com dez valores de "fold-change" (medida da expressão gênica) ao longo do tempo (0, 15, 30, 45, 60, 75, 90, 105, 120 e 135 min). As estimativas dos parâmetros dos modelos autorregressivos AR(p) foram previamente ajustadas a séries individuais (de cada gene) de dados "microarray time series" e utilizadas, como variáveis, no processo de agrupamento. As previsões da expressão gênica foram feitas dentro de cada grupo formado, a partir dos ajustes no modelo AR(p) para dados em painel. O método de Ward foi o mais apropriado para a formação de grupos de genes com séries homogêneas. Uma vez obtidos esses grupos, é possível ajustar o modelo AR(2) para dados em painel e predizer a expressão gênica em um tempo futuro (135 min), a partir de um pequeno número de observações temporais (os outros nove valores de "fold-change").
Resumo:
O objetivo deste trabalho foi integrar dados de caracteres quantitativos, multicategóricos, moleculares e fitopatológicos para a avaliação da diversidade genética de subamostras de tomateiro do Banco de Germoplasma de Hortaliças da Universidade Federal de Viçosa (BGH-UFV). Foram utilizados dados de 67 subamostras de tomateiro do BGH-UFV, caracterizadas quanto a 19 caracteres quantitativos, 30 multicategóricos, 52 locos ISSR e à reação a três patógenos (Alternaria solani, Pseudomonas syringae pv. tomato e Tomato yellow spot virus). Inicialmente, a avaliação da diversidade entre as subamostras foi realizada para cada conjunto de caracteres individualmente, e indicou que a diversidade baseada em qualquer um dos conjuntos de dados não reflete a diversidade dos demais. Para a integração dos dados, codificaram-se os de natureza quantitativa em multicategóricos, por meio de cinco estratégias diferentes. A estratégia de divisão equitativa da amplitude dos dados em três classes foi a mais indicada, com correlação de 0,78 entre as matrizes de dissimilaridade dos dados codificados e originais. A análise de diversidade genética a partir da integração dos dados resultou em grupos com maior correspondência às origens das subamostras de tomateiro avaliadas, o que indica que a integração de dados de diferentes naturezas pode ser realizada com êxito pela conversão dos dados quantitativos em multicategóricos.
Resumo:
O objetivo deste trabalho foi comparar formas de análise de medidas repetidas para o melhoramento da produção de frutos de pinha (Annona squamosa). Vinte progênies de meias-irmãs foram avaliadas por três anos (2003, 2004 e 2005) em delineamento de blocos ao acaso, com cinco repetições, com cada parcela constituída de quatro plantas. A característica avaliada foi o número de frutos por indivíduo. Os modelos de simetria composta, de simetria composta com variâncias heterogêneas, autorregressivo com variâncias heterogêneas, e antedependência estruturada, foram analisados com o programa ASReml. A estimação dos componentes de variância e a predição dos valores genéticos foram feitas com o procedimento REML/BLUP. A comparação dos modelos foi realizada pelo teste de razão de verossimilhança e pelo critério de Akaike. O modelo antedependência estruturada, para os fatores progênie e parcela, e o modelo multivariado, para o fator resíduo, são as melhores abordagens para a análise dos dados, pois propiciam eficiência e parcimônia em relação ao modelo multivariado completo. Com o modelo antedependência estruturada, é possível a identificação de famílias superiores, em cada colheita, e também de famílias com maior número total de frutos.
Resumo:
O objetivo deste trabalho foi parametrizar e avaliar o modelo DSSAT/Canegro para cinco variedades brasileiras de cana-de-açúcar. A parametrização foi realizada a partir do uso de dados biométricos e de crescimento das variedades CTC 4, CTC 7, CTC 20, RB 86-7515 e RB 83-5486, obtidos em cinco localidades brasileiras. Foi realizada análise de sensibilidade local para os principais parâmetros. A parametrização do modelo foi feita por meio da técnica de estimativa da incerteza de probabilidade generalizada ("generalized likelihood uncertainty estimation", Glue). Para a avaliação das predições, foram utilizados, como indicadores estatísticos, o coeficiente de determinação (R²), o índice D de Willmott e a raiz quadrada do erro-médio (RMSE). As variedades CTC apresentaram índice D entre 0,870 e 0,944, para índice de área foliar, altura de colmo, perfilhamento e teor de sacarose. A variedade RB 83-5486 apresentou resultados similares para teor de sacarose e massa de matéria fresca do colmo, enquanto a variedade RB 86-7515 apresentou valores entre 0,665 e 0,873, para as variáveis avaliadas.
Resumo:
O objetivo deste trabalho foi verificar a possibilidade de uso de dados parciais na seleção de codornas de corte para produção de ovos. Foram avaliados os grupos genéticos de codornas de corte UFV1 e UFV2, de origens distintas. Utilizaram-se informações de 1.632 matrizes, das quais 816 provieram do grupo genético UFV1, e 816 do grupo UFV2. Os parâmetros genéticos foram obtidos nos períodos parciais da 6ª semana até a 24ª (P24), a 32ª (P32), a 40ª (P40) e a 48ª (P48) semanas, e no período total de produção de ovos(P52), da 6ª à 52ª semana. Os componentes de variância e covariância e os parâmetros genéticos foram estimados pelo método da máxima verossimilhança restrita, pelo modelo animal unicaracterístico. A produção parcial e a total de ovos foram estimadas pelo modelo animal multicaracterístico, por meio do aplicativo Wombat. Para UFV1, os valores de herdabilidade foram: 0,09, P24; 0,09, P32; 0,09, P40; 0,08, P48; e 0,07 para P52; as correlações genéticas variaram de 0,79 a 0,99. Para UFV2, os valores de herdabilidade foram: 0,09, P24; 0,09, P32; 0,10, P40; 0,11, P48; e 0,13 para P52; as correlações variaram de 0,70 a 0,99. Para a seleção de UFV1, recomenda-se considerar a produção de ovos até a 40ª semana e, para UFV2, até a 48ª semana. As baixas estimativas de herdabilidade indicam que se devem fazer mudanças de manejo para controlar os efeitos de ambiente.
Resumo:
O objetivo deste trabalho foi determinar os parâmetros estatísticos da função densidade de probabilidade (FDP) com melhor ajuste aos valores decendiais de precipitação pluvial observados em diversas localidades brasileiras, e também determinar a relação entre precipitação provável (75% de probabilidade, P75%) e precipitação média () nestas localidades. Foram avaliadas cinco FDPs (normal, triangular, gama, exponencial e uniforme), ajustadas a dados provenientes de 43 municípios, de oito estados, em quatro regiões brasileiras. As localidades foram avaliadas isoladamente ou agrupadas de acordo com estados ou tipos climáticos. O teste de aderência de Kolmogorov‑Smirnov foi utilizado para avaliar o ajuste estatístico das FDPs às séries de dados. As distribuições gama e exponencial foram as que mais frequentemente melhor se ajustaram às séries de precipitação pluvial decendial (41,2 e 30,8%, respectivamente). As relações funcionais mais promissoras entre
e P75% foram obtidas nos climas Cwa (R² = 0,82), Aw (R² = 0,70), As (R² = 0,68) e Cwb (R² = 0,62), e nos estados de Goiás (R² = 0,80), São Paulo (R² = 0,76) e Minas Gerais (R² = 0,70). As distribuições normal (19,3%), triangular (2,2%) e uniforme (3,5%) têm menor participação nos melhores ajustes, mas são importantes nas análises para o período seco.
Resumo:
O objetivo deste trabalho foi ajustar modelos para estimar características dendrométricas da Caatinga brasileira a partir de dados do sensor TM do Landsat 5. Medidas de diâmetro e altura das árvores foram obtidas de 60 parcelas de inventário (400 m2), em dois municípios do Estado de Sergipe. A área basal e o volume de madeira foram estimados com uso de equação alométrica e de fator de forma (f = 0,9). As variáveis explicativas foram obtidas do sensor TM, após correção radiométrica e geométrica, tendo-se considerado, na análise, seis bandas espectrais, com resolução espacial de 30 m, além dos índices de razão simples (SR), de vegetação por diferença normalizada (NDVI) e de vegetação ajustado ao solo (Savi). Na escolha das melhores variáveis explicativas, foram considerados coeficiente de determinação (R2), raiz do erro quadrático médio (RMSE) e critério bayesiano de informação (CBI). A área basal por hectare não apresentou correlação significativa com nenhuma das variáveis explicativas utilizadas. Os melhores modelos foram ajustados à altura média das árvores por parcela (R2 = 0,4; RMSE = 13%) e ao volume de madeira por hectare (R2 = 0,6; RMSE = 42%). As métricas derivadas do sensor TM do Landsat 5 têm grande potencial para explicar variações de altura média das árvores e do volume de madeira por hectare, em remanescentes de Caatinga situados no Nordeste brasileiro.
Resumo:
O objetivo deste trabalho foi avaliar a estimativa da evapotranspiração de referência (ETo), para a região Sudeste do Brasil, a partir de dados meteorológicos limitados. O método de Penman-Monteith FAO 56 (PMp) foi tomado como referência. Três cenários com dados meteorológicos limitados, obtidos de rede de estações automáticas, foram utilizados para estimação da ETo: método padrão (PMp) com uso da radiação solar estimada pelo balanço entre ondas curtas e longas (PMKrs); método padrão com uso da pressão de vapor estimada pelas temperaturas máxima e mínima, e pela umidade relativa do ar (PMea); e método padrão com uso da velocidade de vento constante (2 m s-1; PMu2). A ETo também foi estimada pelos métodos de Hargreaves-Samani (HS) e de Turc. Os modelos foram analisados por meio de indicadores estatísticos de desvio absoluto médio (MBE), erro relativo (ER), raiz quadrada do erro quadrático médio (RMSE) e índice de Willmott (d). O método PMea é a melhor alternativa para estimar a ETo, seguido pelos métodos PMu2, para Espírito Santo e Rio de Janeiro, e PMKrs, para São Paulo e Minas Gerais. Os maiores erros são obtidos com o método de Hargreaves-Samani, que superestimou a ETo em comparação ao PMp, para a maioria das estações avaliadas.
Resumo:
Resumo:O objetivo deste trabalho foi avaliar a eficácia da aplicação de modelos de análise de regressão e redes neurais artificiais (RNAs) na predição do volume de madeira e da biomassa acima do solo, da vegetação arbórea em área de cerradão. Volume de madeira e biomassa foram estimados com equações alométricas desenvolvidas para a área de estudo. Os índices de vegetação, como variáveis preditoras, foram estimados a partir de imagens do sensor LISS-III, e a área basal foi determinada por medições na floresta. A precisão das equações foi verificada pela correlação entre os valores estimados e observados (r), erro-padrão da estimativa (Syx) e gráfico residual. As equações de regressão para o volume de madeira total e do fuste (0,96 e 0,97 para r, e 11,92 e 9,72% para Syx, respectivamente) e para a biomassa (0,91 e 0,92 para r, e 22,73 e 16,80% para Syx, respectivamente) apresentaram bons ajustes. As redes neurais também apresentaram bom ajuste com o volume de madeira (0,99 e 0,99 para r, e 4,93 e 4,83% para Syx) e a biomassa (0,97 e 0,98 r, e 8,92 e 7,96% para Syx, respectivamente). A área basal e os índices de vegetação foram eficazes na estimativa do volume de madeira e biomassa para o cerradão. Os valores reais de volume de madeira e biomassa não diferiram estatisticamente dos valores estimados pelos modelos de regressão e redes neurais (χ2ns); contudo, as RNAs são mais acuradas.
Resumo:
Um problema dos experimentos de campo com plantas perenes e frutíferas arbóreas é o tamanho da área, devido ao porte das plantas que normalmente exigem largos espaçamentos. É muito freqüente, nesses experimentos, o uso de parcelas grandes, em detrimento do número de repetições, com a justificativa de diminuir a área experimental, a mão-de-obra e o conseqüente custo da pesquisa. Essa prática, contudo, traz prejuízos à precisão das estimativas dos parâmetros e à aplicação eficiente de testes estatísticos. Este trabalho foi realizado com o objetivo de mostrar que o aumento do número de repetições com o uso de parcelas pequenas aumenta a precisão dos experimentos, das estimativas do erro experimental e dos efeitos de tratamentos, favorece a detecção de diferenças significativas entre os tratamentos e contribui para diminuir a área experimental. Desenvolveu-se um procedimento que associa o tamanho da unidade experimental ao número de repetições, pela minimização da variância da média de cada tratamento, que permite o uso de maior número de repetições, para aumentar a precisão dos testes, obter maior uniformidade no experimento e melhorar a qualidade das pesquisas. Os resultados obtidos permitiram observar que o uso de parcelas pequenas favorece o aumento do número de repetições, permite obter melhores estimativas do erro experimental, dos efeitos de tratamentos e dos parâmetros, além de dar mais eficiência aos testes estatísticos a serem aplicados aos dados. Observou-se, também, diminuição substancial do número de plantas necessárias aos experimentos e do tamanho da área experimental.
Resumo:
Este trabalho foi realizado com o objetivo de conhecer a influência que algumas variáveis meteorológicas exercem na razão entre sólidos solúveis totais e acidez total titulável ("ratio") e no índice tecnológico dos frutos da primeira florada das laranjeiras-'Natal' e 'Valência', na região de Bebedouro-SP, mediante a utilização de métodos estatísticos de regressão. Foram utilizados dados de amostragens de rotina para o processamento industrial durante 4 anos, os quais permitiram desenvolver equações de regressão linear e quadrática, com a soma térmica (graus-dia) como variável independente, e de regressão múltipla, utilizando graus-dia e chuva como variáveis independentes. A equação de melhor ajuste para o índice tecnológico foi a quadrática, enquanto para o "ratio" a equação linear apresentou o melhor ajuste. A temperatura do ar, representada por graus-dia, foi a variável que exerceu maior influência nos indicadores de qualidade dos frutos.
Resumo:
Em um pomar jovem de laranjeiras Hamlin, não-irrigado, foi realizado um estudo que procurou investigar a potencialidade do uso de dados espectrais de árvores, visando ao gerenciamento localizado da produção de 52 árvores, distribuídas ao longo de duas transeções cruzadas, selecionadas para o levantamento da produção em dois ciclos sucessivos, 2000-2001 e 2001-2002. Imagens aéreas multiespectrais de alta resolução espacial foram tomadas de um pomar, em duas fases fenológicas distintas: antes e após a fase de desenvolvimento vegetativo. Os índices de vegetação NDVI e SAVI e os níveis de cinza nas faixas espectrais do vermelho e do infravermelho foram relacionados com a produção por meio de regressões. Os resultados mostraram que a resposta espectral apresentou relação significativa com a produção, embora os valores de r² tenham sido baixos. A tomada de imagens multiespectrais voltadas ao gerenciamento localizado da produção, tanto na época anterior, como posterior à fase de desenvolvimento vegetativo, apresentou desempenho semelhante quanto às relações entre resposta espectral e produção.
Resumo:
Em um pomar jovem de laranjeiras Hamlin, não-irrigado, foi realizado um estudo que procurou investigar a potencialidade da utilização de dados espaço-temporais de produção por árvore para o gerenciamento localizado. A produção de 1.471 árvores georreferenciadas foi levantada em dois ciclos sucessivos, 2000-2001 e 2001-2002, e classificada por meio de uma análise de agrupamentos via lógica fuzzy. Ainda, foi realizada uma análise de correlação intraclasse com dados de resposta espectral de 52 árvores, extraída de imagens aéreas multiespectrais de alta resolução espacial. Os resultados mostraram que foi possível a formação de classes distintas de comportamento produtivo, em função dos padrões de variabilidade espacial e temporal da produção. No entanto, as classes apresentaram baixa coerência espacial, o que dificulta o gerenciamento localizado da produção em nível de árvores individuais. A despeito disso, a resposta espectral esteve significativamente relacionada às classes formadas.
Resumo:
Os marcadores microssatélites são ferramentas úteis em diversas análises genéticas em plantas. No caso do mamoeiro (Carica papaya L.), poucos locos de microssatélites foram descritos até o momento. Assim, o objetivo deste trabalho foi explorar a base de dados do GenBank / NCBI (National Center of Biotechnoloy Information) à procura de microssatélites de mamoeiro, visando a seu futuro uso em estudos genéticos e moleculares aplicados ao melhoramento genético. As seqüências foram obtidas no GenBank / NCBI, no formato FASTA, e analisadas para a presença de microssatélites com um mínimo de 20; 7 e 5 repetições dos motivos de mono-, di- e trinucleotídeos, respectivamente, e acima de 4 repetições para tetra- e pentanucleotídeos. Seqüências com mais de 90% de similaridade foram consideradas redundantes e, portanto, eliminadas das análises. Foram analisadas 44.591 seqüências, das quais 3.180 foram não-redundantes e apresentaram 3.947 microssatélites. Desse total, 3.587 foram classificados como microssatélites perfeitos, 8 imperfeitos, 65 interrompidos, 239 compostos-perfeitos, 8 compostos-imperfeitos e 40 compostos-interrompidos. As repetições de di- e trinucleotídeos representaram 65,7 e 14,4% do total de seqüências analisadas, respectivamente. Somente os motivos do tipo AT/TA representaram 44,1% dos microssatélites encontrados. Os motivos mais comuns de tri-, tetra- e pentanucleotídeos foram AAT, AATT e TTTAA, respectivamente. Observou-se que, nas seqüências disponíveis, o genoma do mamoeiro apresenta, em média, um microssatélite a cada 5,65 kb.
Resumo:
Foi elaborado um sistema para gerenciamento informatizado dos testes de controle de qualidade exigidos pela Portaria 453/98 da Secretaria de Vigilância Sanitária do Ministério da Saúde, visando otimizar sua execução, armazenamento e interpretação. Os testes de controle de qualidade são parte do programa de garantia de qualidade que deve ser implantado em toda instalação de radiodiagnóstico médico e odontológico. Para isso, foi elaborado um banco de dados utilizando o programa Microsoft Access®, permitindo comunicação direta com o sistema informatizado de gerenciamento das manutenções dos equipamentos de raios X, em implantação no Hospital Universitário Clementino Fraga Filho da Universidade Federal do Rio de Janeiro.