223 resultados para Análise Conjunta de Quadros de Dados
Resumo:
O objetivo deste trabalho foi determinar a melhor alternativa, entre os métodos de agrupamento hierárquico (Ward) e de otimização (Tocher), para a formação de grupos homogêneos de séries de expressão gênica, e realizar previsões quanto à expressão gênica dessas séries, a partir de pequeno número de observações temporais. Os dados utilizados referem-se à expressão de genes que atuam sobre o ciclo celular de Saccharomyces cerevisiae e corresponderam a 114 séries de expressão gênica, cada uma com dez valores de "fold-change" (medida da expressão gênica) ao longo do tempo (0, 15, 30, 45, 60, 75, 90, 105, 120 e 135 min). As estimativas dos parâmetros dos modelos autorregressivos AR(p) foram previamente ajustadas a séries individuais (de cada gene) de dados "microarray time series" e utilizadas, como variáveis, no processo de agrupamento. As previsões da expressão gênica foram feitas dentro de cada grupo formado, a partir dos ajustes no modelo AR(p) para dados em painel. O método de Ward foi o mais apropriado para a formação de grupos de genes com séries homogêneas. Uma vez obtidos esses grupos, é possível ajustar o modelo AR(2) para dados em painel e predizer a expressão gênica em um tempo futuro (135 min), a partir de um pequeno número de observações temporais (os outros nove valores de "fold-change").
Resumo:
O objetivo deste trabalho foi comparar formas de análise de medidas repetidas para o melhoramento da produção de frutos de pinha (Annona squamosa). Vinte progênies de meias-irmãs foram avaliadas por três anos (2003, 2004 e 2005) em delineamento de blocos ao acaso, com cinco repetições, com cada parcela constituída de quatro plantas. A característica avaliada foi o número de frutos por indivíduo. Os modelos de simetria composta, de simetria composta com variâncias heterogêneas, autorregressivo com variâncias heterogêneas, e antedependência estruturada, foram analisados com o programa ASReml. A estimação dos componentes de variância e a predição dos valores genéticos foram feitas com o procedimento REML/BLUP. A comparação dos modelos foi realizada pelo teste de razão de verossimilhança e pelo critério de Akaike. O modelo antedependência estruturada, para os fatores progênie e parcela, e o modelo multivariado, para o fator resíduo, são as melhores abordagens para a análise dos dados, pois propiciam eficiência e parcimônia em relação ao modelo multivariado completo. Com o modelo antedependência estruturada, é possível a identificação de famílias superiores, em cada colheita, e também de famílias com maior número total de frutos.
Resumo:
Em um pomar jovem de laranjeiras Hamlin, não-irrigado, foi realizado um estudo que procurou investigar a potencialidade do uso de dados espectrais de árvores, visando ao gerenciamento localizado da produção de 52 árvores, distribuídas ao longo de duas transeções cruzadas, selecionadas para o levantamento da produção em dois ciclos sucessivos, 2000-2001 e 2001-2002. Imagens aéreas multiespectrais de alta resolução espacial foram tomadas de um pomar, em duas fases fenológicas distintas: antes e após a fase de desenvolvimento vegetativo. Os índices de vegetação NDVI e SAVI e os níveis de cinza nas faixas espectrais do vermelho e do infravermelho foram relacionados com a produção por meio de regressões. Os resultados mostraram que a resposta espectral apresentou relação significativa com a produção, embora os valores de r² tenham sido baixos. A tomada de imagens multiespectrais voltadas ao gerenciamento localizado da produção, tanto na época anterior, como posterior à fase de desenvolvimento vegetativo, apresentou desempenho semelhante quanto às relações entre resposta espectral e produção.
Resumo:
OBJETIVO: Apresentar a experiência do serviço de radiologia do Hospital Santa Cecília, São Paulo, SP, no manejo das biópsias pulmonares por aspiração através de agulha fina e biópsias por fragmentos guiadas por tomografia computadorizada e a análise de sua importância e associação com suas complicações. MATERIAIS E MÉTODOS: Foram analisadas 168 biópsias guiadas por tomografia, sendo 84 em homens e 84 em mulheres. Utilizou-se a técnica de biópsia por aspiração por agulha fina em 64 pacientes, a técnica de biópsia por fragmento em 68 pacientes e ambas as técnicas em 36 pacientes. RESULTADOS: Pneumotórax ocorreu em 38 pacientes e a hemorragia pulmonar, em dez pacientes. As dimensões das lesões biopsiadas variaram de 0,5 cm até 15 cm. O diagnóstico foi realizado na primeira tentativa em 132 casos e na segunda tentativa em dez casos. CONCLUSÃO: A acurácia das biópsias aspirativas por agulha fina e por fragmento de lesões pulmonares depende do tamanho da lesão e da colaboração do paciente. Essas técnicas são relativamente seguras e têm acurácia diagnóstica elevada quando feitas por um profissional experiente.
Resumo:
The modern technological ability to handle large amounts of information confronts the chemist with the necessity to re-evaluate the statistical tools he routinely uses. Multivariate statistics furnishes theoretical bases for analyzing systems involving large numbers of variables. The mathematical calculations required for these systems are no longer an obstacle due to the existence of statistical packages that furnish multivariate analysis options. Here basic concepts of two multivariate statistical techniques, principal component and hierarchical cluster analysis that have received broad acceptance for treating chemical data are discussed.
Resumo:
In spite of the availability of large databases of chromatographic data on several standardized systems, one major task in systematic toxicological analysis remains, namely how to handle the experimental data and retrieve data from the large available databases in a meaningful and productive way. To achieve this purpose, our group proposed an Internet-based tool using previously published STA databases, which interlaboratorial reproducibility tests have already evaluated. The developed software has the capability to calculate corrected chromatographic parameters, after the input of data obtained with standard mixtures of calibrators, and search the databases, currently incorporating TLC, color reactions, GC and HPLC data. At the end of the process, a list with candidate substances and their similarity indexes is presented.
Resumo:
The objective of this work was to develop a free access exploratory data analysis software application for academic use that is easy to install and can be handled without user-level programming due to extensive use of chemometrics and its association with applications that require purchased licenses or routines. The developed software, called Chemostat, employs Hierarchical Cluster Analysis (HCA), Principal Component Analysis (PCA), intervals Principal Component Analysis (iPCA), as well as correction methods, data transformation and outlier detection. The data can be imported from the clipboard, text files, ASCII or FT-IR Perkin-Elmer “.sp” files. It generates a variety of charts and tables that allow the analysis of results that can be exported in several formats. The main features of the software were tested using midinfrared and near-infrared spectra in vegetable oils and digital images obtained from different types of commercial diesel. In order to validate the software results, the same sets of data were analyzed using Matlab© and the results in both applications matched in various combinations. In addition to the desktop version, the reuse of algorithms allowed an online version to be provided that offers a unique experience on the web. Both applications are available in English.
Resumo:
The objective of this work is to demonstrate the efficient utilization of the Principal Components Analysis (PCA) as a method to pre-process the original multivariate data, that is rewrite in a new matrix with principal components sorted by it's accumulated variance. The Artificial Neural Network (ANN) with backpropagation algorithm is trained, using this pre-processed data set derived from the PCA method, representing 90.02% of accumulated variance of the original data, as input. The training goal is modeling Dissolved Oxygen using information of other physical and chemical parameters. The water samples used in the experiments are gathered from the Paraíba do Sul River in São Paulo State, Brazil. The smallest Mean Square Errors (MSE) is used to compare the results of the different architectures and choose the best. The utilization of this method allowed the reduction of more than 20% of the input data, which contributed directly for the shorting time and computational effort in the ANN training.
Resumo:
O objetivo deste trabalho foi empregar a análise exploratória de dados, no caso, a técnica de análise de componentes principais (PCA) como ferramenta na avaliação de modificadores químicos na determinação direta e simultânea de Al, As, Cu, Fe, Mn e Ni em álcool etílico combustível por espectrometria de absorção atômica em forno de grafite (GFAAS). Os modificadores químicos avaliados foram: Pd(NO3)2 + Mg(NO3)2; W/Rh; W+ co-injeção de Pd(NO3)2 + Mg(NO3)2 e para cada modificador foram utilizadas trintas amostras de álcool etílico combustível. Como dados experimentais foram utilizados os resultados dos testes de adição e recuperação dos analitos frente aos diferentes modificadores químicos estudados. O emprego da técnica de PCA possibilitou a separação dos tipos de modificadores em função do intervalo de recuperação do analito. Dentre os modificadores avaliados, W+ co-injeção de Pd(NO3)2 + Mg(NO3)2 apresentou-se como a espécie de maior correlação positiva, pois apresenta os maiores teores de recuperação, e sendo assim, foi o escolhido para o desenvolvimento de metodologia para determinação direta e simultânea de Al, As, Cu, Fe, Mn e Ni em álcool etílico combustível por GFAAS.
Resumo:
Foram analisadas amostras de quiabo dos municípios de Caruaru e Vitória de Santo Antão, em Pernambuco, assim como nos municípios de Ceará-Mirim, Macaíba e Extremoz no estado do Rio Grande do Norte. A aplicação de dois métodos de análise exploratória de dados: Análise de Componentes principais - PCA e Análise de Agrupamentos Hierárquicos - HCA permitiu a discriminação geográfica do quiabo proveniente dos dois estados.
Resumo:
Esta pesquisa originou-se de uma base de dados de dois inventários a 100%, realizados em 1984 e 2000 sobre uma mesma área de 576 ha de floresta tropical primária, localizada na Floresta Nacional do Tapajós, Belterra, Pará. O objetivo da pesquisa foi utilizar a análise exploratória de dados e a regressão robusta para modelar o crescimento em diâmetro e área basal. Nos dois inventários as circunferências à altura do peito (CAP) foram medidas com fitamétrica, enquanto as alturas comerciais em 1984 foram medidas com o hipsômetro de Weiss e em 2000, estimadas com o uso de varas; o DAP mínimo em 1984 foi de 55 cm para todas as espécies e em 2000 foi adotado o DAP mínimo de 35 cm. As análises estatísticas foram precedidas de análise exploratória de dados (AED), em que foram utilizados o box plot (caixa-de-bigodes) na detecção de outliers (observações discrepantes) e o gráfico stem-and-leaf (tronco-e-folhas) para filtrar as observações extremas. Utilizou-se a regressão robusta para ajustar os modelos na presença de outliers. A pesquisa mostrou que, apesar das variações intra e interespecíficas, as seis espécies, em conjunto, apresentaram taxas de crescimento medianas observadas e esperadas em diâmetro e área basal de 4,56 e 4,28 mm/ano e 13,00 e 13,09 cm²/ha/ano, respectivamente. A pesquisa também mostrou que o uso da análise exploratória de dados e da regressão robusta viabilizou a análise e a determinação dos incrementos periódicos em diâmetro e área basal em bases consistentes. A metodologia empregada no caso específico dos dados disponíveis e tipos de variáveis mostrou ser mais eficiente com o uso de regressão robusta pelo método Least Trimmed Square do que pelo método dos mínimos quadrados ordinários.
Resumo:
Os delineamentos sistemáticos se destacam pela sua compacidade e abrangência e por permitir testar maior número de espaçamentos possíveis. No entanto, não é utilizado devido ao arranjo sistemático (não casualizado) das plantas e à alta sensibilidade para valores perdidos. O objetivo deste trabalho foi descrever o modelo geoestatístico e métodos associados de inferência no contexto de análise de experimentos não aleatorizados, reportando resultados aplicados para identificar a dependência espacial em um particular experimento em delineamento sistemático tipo leque de Eucalyptus dunnii. Também foram propostas, analisadas e comparadas diferentes alternativas para tratar dados faltantes que pudessem advir de falhas e, ou, mortalidade de plantas. Os dados foram analisados seguindo-se três modelos que diferiram, com co-variáveis, na forma de tratar os dados faltantes. Para cada um destes foi construído um semivariograma, com o ajuste de três modelos de função de correlação, sendo os parâmetros estimados pelo método de máxima verossimilhança e selecionados pelo critério de Akaike. Esses modelos, com e sem o componente espacial, foram comparados pelo teste da razão de verossimilhança. De acordo com os resultados, verificou-se que: (1) as co-variáveis interagiram positivamente com a variável de resposta, evitando que dados coletados sejam desperdiçados; (2) a comparação dos modelos, com e sem o componente espacial, não confirmou a existência de dependência; (3) a incorporação da estrutura de dependência espacial aos modelos observacionais recuperou a capacidade de fazer inferências válidas na ausência de aleatorização, permitindo contornar problemas operacionais e, assim, garantindo que os dados possam ser submetidos a uma análise clássica.
Resumo:
Os métodos atualmente utilizados para realização de análise sensorial têm deixado muito a desejar por não traduzir satisfatoriamente os resultados. Diante deste problema, analisou-se a possibilidade de introdução de um fator que medisse o índice de concordância dos provadores sobre determinado aspecto analisado. Para validação deste coeficiente, foi avaliada a concordância entre julgadores na análise sensorial para três diferentes amostras de suco de pinha (Annona squamosa L.): uma constituída apenas do suco de pinha sem leite e duas com diferentes concentrações pinha/leite. Utilizou-se a Análise de Componentes Principais (ACP) e também a nova metodologia proposta pelos autores, com base na definição do desvio-padrão, aplicada às frequências absolutas das notas dos julgadores, para cada propriedade sensorial estudada. Com esta metodologia, definiu-se uma relação para o cálculo de uma medida de concordância entre os julgadores, denominada de coeficiente de concordância, a qual pode assumir valores de 0 a 100% e também permite comparações que não são possíveis, utilizando-se da ACP. Por fim, concluiu-se que tal metodologia é mais indicada que a ACP, na avaliação da concordância entre os julgadores na análise sensorial.
Resumo:
O objetivo deste trabalho foi analisar o comportamento espaçotemporal da precipitação pluvial no Estado do Rio Grande do Sul, entre os decênios de 1987-1996 e 1997-2006, por meio de técnicas de mineração de dados. As séries históricas foram adquiridas no sistema de informações hidrológicas Hidroweb. A metodologia utilizada teve como base o modelo CRISP-DM (Cross Industry Standard Process for Data Mining). Foram definidas áreas pluviometricamente homogêneas para os decênios de 1987-1996 e 1997-2006. Em seguida, pela sobreposição dos agrupamentos obtidos para os dois períodos, encontraram-se seis zonas comuns aos dois decênios (A a F). As alterações ocorridas foram avaliadas nas seguintes escalas temporais: anual, sazonal e mensalmente. Os resultados indicaram incrementos significativos (20 a 240 mm) na precipitação anual em todas as zonas, exceto na zona A. Na análise sazonal, as variações foram aleatórias, sendo que, na primavera, todas as zonas apresentaram incremento significativo (44 a 142 mm). Na análise mensal, destaca-se a redução ocorrida no mês de janeiro em todas as zonas, exceto na E. Nos demais meses, as variações foram aleatórias. Os resultados mostram que, entre os decênios, houve uma alteração no volume da precipitação pluvial em todas as escalas temporais analisadas.