997 resultados para Limpeza de dados


Relevância:

20.00% 20.00%

Publicador:

Resumo:

A cor do solo é uma propriedade que deriva de alguns atributos do próprio solo, entre eles, do teor de óxidos de ferro. Desse modo, o estabelecimento de relações funcionais entre dados referentes à caracterização da cor e teores de óxidos de ferro apresenta-se como uma alternativa simples e rápida para a semiquantificação dos teores dos referidos óxidos. O objetivo do presente trabalho foi semiquantificar os teores de hematita na fração argila, em laboratório, a partir da avaliação automatizada das cores de amostras de solos do Estado de São Paulo, utilizando um colorímetro e um espectrorradiômetro. Os dados obtidos por radiometria serviram de base para a determinação da cor nos sistemas L*a*b* e Munsell, bem como para o cálculo de índices de avermelhamento (IAVs). Os IAVs apresentaram dependência funcional dos teores de hematita e foram as melhores relações verificadas com os índices determinados a partir de cores no sistema L*a*b*. Modelos exponenciais, baseados em dados obtidos por sensores, mostram-se adequados na predição dos teores de hematita.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O objetivo deste trabalho foi avaliar o impacto do aumento da resolução espacial e radiométrica da imagem pancromática do Ikonos-II na identificação de plantios de café (Coffea arabica), em comparação com as imagens do Landsat/ETM+. A área de estudo está localizada no Município de Pedregulho, SP, onde foram selecionados 50 talhões com plantios de café, e foram levantados dados referentes à altura, idade, espaçamento e variedade de cada talhão. As imagens permitiram a identificação de talhões com características diferentes em campo, tendo-se destacado a imagem do Ikonos-II, que apresentou melhor desempenho. Para os talhões com características iguais em campo, as imagens analisadas não se mostraram eficientes, independentemente do satélite utilizado. As correções atmosféricas e radiométricas, na imagem do Ikonos-II, não proporcionaram ganho efetivo nas análises realizadas. A maioria dos talhões identificados na imagem do Ikonos-II pode ser localizada na imagem do Landsat/ETM+ (68%). A correlação significativa entre a banda 4 do Landsat/ETM+ e o canal pancromático do Ikonos-II indica uma forma de ligação entre as imagens dos dois satélites.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O objetivo deste trabalho foi avaliar uma metodologia para estimar a produtividade potencial da cultura do milho de acordo com valores médios diários de temperatura do ar e radiação solar, utilizando procedimento estocástico. Valores registrados da temperatura média diária do ar durante 86 anos e da radiação solar global diária durante 25 anos, foram fornecidos pela Estação Agrometeorológica de Piracicaba (Esalq/USP). Valores correspondentes à produtividade potencial foram simulados 1.000 vezes, em cada data de semeadura considerada (15/10 - época normal; 15/2 - safrinha; e 15/8 - safra de inverno). Foram considerados dois casos na distribuição de probabilidade normal truncada (valores extremos: média - 1,96 desvio-padrão e média + 1,96 desvio-padrão): temperatura média diária variável e radiação solar global diária constante, e temperatura média diária constante e radiação solar global diária variável. A metodologia de estimação permite definir a ordem de grandeza da produtividade potencial de milho a determinada localidade, com base nos dados de temperatura e radiação solar. O procedimento estocástico proposto permite associar a produtividade potencial de milho a determinada probabilidade.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O objetivo deste trabalho foi determinar épocas de avaliação da produtividade e de componentes da produção que permitam selecionar precocemente genótipos superiores de maracujazeiro. Foram avaliados 111 acessos de maracujazeiro amarelo, do Sul e Sudeste brasileiros, durante duas safras consecutivas. Avaliaram-se, mensalmente, as variáveis produção por planta, número de frutos por planta e peso médio de frutos. Os valores mensais e anuais dessas variáveis foram correlacionados à produção total acumulada em dois anos. Entre os dados mensais, os do terceiro mês tiveram a melhor correlação com os dados acumulados. Seleções positivas e negativas foram simuladas com os dados do terceiro mês e comparadas à seleção feita com base nos dados acumulados em dois anos. Os dados do terceiro mês da primeira safra foram adequados para a seleção quanto ao peso de frutos, mas as variáveis número de frutos e produtividade por planta seriam melhor selecionadas com os dados do terceiro mês da segunda safra.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O objetivo deste trabalho foi avaliar a conveniência de definir o número de componentes multiplicativos dos modelos de efeitos principais aditivos com interação multiplicativa (AMMI) em experimentos de interações genótipo x ambiente de algodão com dados imputados ou desbalanceados. Um estudo de simulação foi realizado com base em uma matriz de dados reais de produtividade de algodão em caroço, obtidos em ensaios de interação genótipo x ambiente, conduzidos com 15 cultivares em 27 locais no Brasil. A simulação foi feita com retiradas aleatórias de 10, 20 e 30% dos dados. O número ótimo de componentes multiplicativos para o modelo AMMI foi determinado usando o teste de Cornelius e o teste de razão de verossimilhança sobre as matrizes completadas por imputação. Para testar as hipóteses, quando a análise é feita a partir de médias e não são disponibilizadas as repetições, foi proposta uma correção com base nas observações ausentes no teste de Cornelius. Para a imputação de dados, foram considerados métodos usando submodelos robustos, mínimos quadrados alternados e imputação múltipla. Na análise de experimentos desbalanceados, é recomendável escolher o número de componentes multiplicativos do modelo AMMI somente a partir da informação observada e fazer a estimação clássica dos parâmetros com base nas matrizes completadas por imputação.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O objetivo deste trabalho foi desenvolver uma metodologia para mapeamento digital de solos na escala 1:100.000 com a aplicação de técnicas de mineração de dados a descritores de relevo e a dados de mapas geológico e pedológico preexistentes. Foi criada uma base de dados digitais a partir de cartas topográficas e temáticas, que permitiu elaboração do modelo digital de elevação (MDE) da folha Dois Córregos, SP (escala 1:50.000). A partir do MDE, foram calculados os parâmetros geomorfométricos declividade, curvaturas em planta e perfil, área de contribuição e distância diagonal de drenagem. A matriz que associou esses dados georreferenciados foi analisada por meio de árvores de decisão, no ambiente de aprendizado de máquina Weka, o que gerou um modelo de predição de unidades de mapeamento de solos. A acurácia geral do modelo aumentou de 54 para 61% com a eliminação das classes com probabilidade nula de ocorrência. A associação da mineração de dados com sistemas de informações geográficas permite a elaboração de mapas digitais passíveis de uso em estudos que requeiram menor detalhamento que aqueles realizados com o mapa original.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O objetivo deste trabalho foi avaliar a eficiência da aplicação do modelo SEBAL em estimar os fluxos de energia em superfície e a evapotranspiração diária, numa extensa área de cultivo de arroz irrigado, no município de Paraíso do Sul, RS, tendo como parâmetros dados do sensor ASTER. As variáveis estudadas constituem importantes parâmetros do tempo e do clima em estudos agrometeorológicos e de racionalização no uso da água. As metodologias convencionais de estimativa desses parâmetros são pontuais e geralmente apresentam incertezas, que aumentam quando o interesse é o comportamento espacial desses parâmetros. Aplicou-se o algoritmo "Surface Energy Balance Algorithm for Land" (SEBAL), em uma imagem do sensor "Advanced Spaceborne Thermal Emission and Reflection Radiometer" (ASTER). As estimativas obtidas foram comparadas com medições em campo, realizadas por uma estação micrometeorológica localizada no interior da área de estudo. As estimativas mais precisas foram as de fluxo de calor sensível e de evapotranspiração diária, e a estimativa que apresentou maior erro foi a do fluxo de calor no solo. A metodologia empregada foi capaz de reproduzir os fluxos de energia em superfície de maneira satisfatória para estudos agrometeorológicos e de rendimento de culturas.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O objetivo deste trabalho foi avaliar variáveis discriminantes no mapeamento digital de solos com uso de redes neurais artificiais. Os atributos topográficos elevação, declividade, aspecto, plano de curvatura e índice topográfico, derivados de um modelo digital de elevação, e os índices de minerais de argila, óxido de ferro e vegetação por diferença normalizada, derivados de uma imagem do Landsat7, foram combinados e avaliados quanto à capacidade de discriminação dos solos de uma área no noroeste do Estado do Rio de Janeiro. Foram utilizados o simulador de redes neurais Java e o algoritmo de aprendizado "backpropagation". Os mapas gerados por cada um dos seis conjuntos de variáveis testados foram comparados com pontos de referência, para a determinação da exatidão das classificações. Esta comparação mostrou que o mapa produzido com a utilização de todas as variáveis obteve um desempenho superior (73,81% de concordância) ao de mapas produzidos pelos demais conjuntos de variáveis. Possíveis fontes de erro na utilização dessa abordagem estão relacionadas, principalmente, à grande heterogeneidade litológica da área, que dificultou o estabelecimento de um modelo de correlação ambiental mais realista. A abordagem utilizada pode contribuir para tornar o levantamento de solos no Brasil mais rápido e menos subjetivo.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O objetivo deste trabalho foi determinar a melhor alternativa, entre os métodos de agrupamento hierárquico (Ward) e de otimização (Tocher), para a formação de grupos homogêneos de séries de expressão gênica, e realizar previsões quanto à expressão gênica dessas séries, a partir de pequeno número de observações temporais. Os dados utilizados referem-se à expressão de genes que atuam sobre o ciclo celular de Saccharomyces cerevisiae e corresponderam a 114 séries de expressão gênica, cada uma com dez valores de "fold-change" (medida da expressão gênica) ao longo do tempo (0, 15, 30, 45, 60, 75, 90, 105, 120 e 135 min). As estimativas dos parâmetros dos modelos autorregressivos AR(p) foram previamente ajustadas a séries individuais (de cada gene) de dados "microarray time series" e utilizadas, como variáveis, no processo de agrupamento. As previsões da expressão gênica foram feitas dentro de cada grupo formado, a partir dos ajustes no modelo AR(p) para dados em painel. O método de Ward foi o mais apropriado para a formação de grupos de genes com séries homogêneas. Uma vez obtidos esses grupos, é possível ajustar o modelo AR(2) para dados em painel e predizer a expressão gênica em um tempo futuro (135 min), a partir de um pequeno número de observações temporais (os outros nove valores de "fold-change").

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O objetivo deste trabalho foi integrar dados de caracteres quantitativos, multicategóricos, moleculares e fitopatológicos para a avaliação da diversidade genética de subamostras de tomateiro do Banco de Germoplasma de Hortaliças da Universidade Federal de Viçosa (BGH-UFV). Foram utilizados dados de 67 subamostras de tomateiro do BGH-UFV, caracterizadas quanto a 19 caracteres quantitativos, 30 multicategóricos, 52 locos ISSR e à reação a três patógenos (Alternaria solani, Pseudomonas syringae pv. tomato e Tomato yellow spot virus). Inicialmente, a avaliação da diversidade entre as subamostras foi realizada para cada conjunto de caracteres individualmente, e indicou que a diversidade baseada em qualquer um dos conjuntos de dados não reflete a diversidade dos demais. Para a integração dos dados, codificaram-se os de natureza quantitativa em multicategóricos, por meio de cinco estratégias diferentes. A estratégia de divisão equitativa da amplitude dos dados em três classes foi a mais indicada, com correlação de 0,78 entre as matrizes de dissimilaridade dos dados codificados e originais. A análise de diversidade genética a partir da integração dos dados resultou em grupos com maior correspondência às origens das subamostras de tomateiro avaliadas, o que indica que a integração de dados de diferentes naturezas pode ser realizada com êxito pela conversão dos dados quantitativos em multicategóricos.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O objetivo deste trabalho foi comparar formas de análise de medidas repetidas para o melhoramento da produção de frutos de pinha (Annona squamosa). Vinte progênies de meias-irmãs foram avaliadas por três anos (2003, 2004 e 2005) em delineamento de blocos ao acaso, com cinco repetições, com cada parcela constituída de quatro plantas. A característica avaliada foi o número de frutos por indivíduo. Os modelos de simetria composta, de simetria composta com variâncias heterogêneas, autorregressivo com variâncias heterogêneas, e antedependência estruturada, foram analisados com o programa ASReml. A estimação dos componentes de variância e a predição dos valores genéticos foram feitas com o procedimento REML/BLUP. A comparação dos modelos foi realizada pelo teste de razão de verossimilhança e pelo critério de Akaike. O modelo antedependência estruturada, para os fatores progênie e parcela, e o modelo multivariado, para o fator resíduo, são as melhores abordagens para a análise dos dados, pois propiciam eficiência e parcimônia em relação ao modelo multivariado completo. Com o modelo antedependência estruturada, é possível a identificação de famílias superiores, em cada colheita, e também de famílias com maior número total de frutos.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O objetivo deste trabalho foi verificar a possibilidade de uso de dados parciais na seleção de codornas de corte para produção de ovos. Foram avaliados os grupos genéticos de codornas de corte UFV1 e UFV2, de origens distintas. Utilizaram-se informações de 1.632 matrizes, das quais 816 provieram do grupo genético UFV1, e 816 do grupo UFV2. Os parâmetros genéticos foram obtidos nos períodos parciais da 6ª semana até a 24ª (P24), a 32ª (P32), a 40ª (P40) e a 48ª (P48) semanas, e no período total de produção de ovos(P52), da 6ª à 52ª semana. Os componentes de variância e covariância e os parâmetros genéticos foram estimados pelo método da máxima verossimilhança restrita, pelo modelo animal unicaracterístico. A produção parcial e a total de ovos foram estimadas pelo modelo animal multicaracterístico, por meio do aplicativo Wombat. Para UFV1, os valores de herdabilidade foram: 0,09, P24; 0,09, P32; 0,09, P40; 0,08, P48; e 0,07 para P52; as correlações genéticas variaram de 0,79 a 0,99. Para UFV2, os valores de herdabilidade foram: 0,09, P24; 0,09, P32; 0,10, P40; 0,11, P48; e 0,13 para P52; as correlações variaram de 0,70 a 0,99. Para a seleção de UFV1, recomenda-se considerar a produção de ovos até a 40ª semana e, para UFV2, até a 48ª semana. As baixas estimativas de herdabilidade indicam que se devem fazer mudanças de manejo para controlar os efeitos de ambiente.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O objetivo deste trabalho foi ajustar modelos para estimar características dendrométricas da Caatinga brasileira a partir de dados do sensor TM do Landsat 5. Medidas de diâmetro e altura das árvores foram obtidas de 60 parcelas de inventário (400 m2), em dois municípios do Estado de Sergipe. A área basal e o volume de madeira foram estimados com uso de equação alométrica e de fator de forma (f = 0,9). As variáveis explicativas foram obtidas do sensor TM, após correção radiométrica e geométrica, tendo-se considerado, na análise, seis bandas espectrais, com resolução espacial de 30 m, além dos índices de razão simples (SR), de vegetação por diferença normalizada (NDVI) e de vegetação ajustado ao solo (Savi). Na escolha das melhores variáveis explicativas, foram considerados coeficiente de determinação (R2), raiz do erro quadrático médio (RMSE) e critério bayesiano de informação (CBI). A área basal por hectare não apresentou correlação significativa com nenhuma das variáveis explicativas utilizadas. Os melhores modelos foram ajustados à altura média das árvores por parcela (R2 = 0,4; RMSE = 13%) e ao volume de madeira por hectare (R2 = 0,6; RMSE = 42%). As métricas derivadas do sensor TM do Landsat 5 têm grande potencial para explicar variações de altura média das árvores e do volume de madeira por hectare, em remanescentes de Caatinga situados no Nordeste brasileiro.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

O objetivo deste trabalho foi avaliar a estimativa da evapotranspiração de referência (ETo), para a região Sudeste do Brasil, a partir de dados meteorológicos limitados. O método de Penman-Monteith FAO 56 (PMp) foi tomado como referência. Três cenários com dados meteorológicos limitados, obtidos de rede de estações automáticas, foram utilizados para estimação da ETo: método padrão (PMp) com uso da radiação solar estimada pelo balanço entre ondas curtas e longas (PMKrs); método padrão com uso da pressão de vapor estimada pelas temperaturas máxima e mínima, e pela umidade relativa do ar (PMea); e método padrão com uso da velocidade de vento constante (2 m s-1; PMu2). A ETo também foi estimada pelos métodos de Hargreaves-Samani (HS) e de Turc. Os modelos foram analisados por meio de indicadores estatísticos de desvio absoluto médio (MBE), erro relativo (ER), raiz quadrada do erro quadrático médio (RMSE) e índice de Willmott (d). O método PMea é a melhor alternativa para estimar a ETo, seguido pelos métodos PMu2, para Espírito Santo e Rio de Janeiro, e PMKrs, para São Paulo e Minas Gerais. Os maiores erros são obtidos com o método de Hargreaves-Samani, que superestimou a ETo em comparação ao PMp, para a maioria das estações avaliadas.

Relevância:

20.00% 20.00%

Publicador:

Resumo:

Resumo:O objetivo deste trabalho foi avaliar a eficácia da aplicação de modelos de análise de regressão e redes neurais artificiais (RNAs) na predição do volume de madeira e da biomassa acima do solo, da vegetação arbórea em área de cerradão. Volume de madeira e biomassa foram estimados com equações alométricas desenvolvidas para a área de estudo. Os índices de vegetação, como variáveis preditoras, foram estimados a partir de imagens do sensor LISS-III, e a área basal foi determinada por medições na floresta. A precisão das equações foi verificada pela correlação entre os valores estimados e observados (r), erro-padrão da estimativa (Syx) e gráfico residual. As equações de regressão para o volume de madeira total e do fuste (0,96 e 0,97 para r, e 11,92 e 9,72% para Syx, respectivamente) e para a biomassa (0,91 e 0,92 para r, e 22,73 e 16,80% para Syx, respectivamente) apresentaram bons ajustes. As redes neurais também apresentaram bom ajuste com o volume de madeira (0,99 e 0,99 para r, e 4,93 e 4,83% para Syx) e a biomassa (0,97 e 0,98 r, e 8,92 e 7,96% para Syx, respectivamente). A área basal e os índices de vegetação foram eficazes na estimativa do volume de madeira e biomassa para o cerradão. Os valores reais de volume de madeira e biomassa não diferiram estatisticamente dos valores estimados pelos modelos de regressão e redes neurais (χ2ns); contudo, as RNAs são mais acuradas.