998 resultados para Dados multivariados


Relevância:

100.00% 100.00%

Publicador:

Resumo:

The modern technological ability to handle large amounts of information confronts the chemist with the necessity to re-evaluate the statistical tools he routinely uses. Multivariate statistics furnishes theoretical bases for analyzing systems involving large numbers of variables. The mathematical calculations required for these systems are no longer an obstacle due to the existence of statistical packages that furnish multivariate analysis options. Here basic concepts of two multivariate statistical techniques, principal component and hierarchical cluster analysis that have received broad acceptance for treating chemical data are discussed.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

The objective of this work was to develop a free access exploratory data analysis software application for academic use that is easy to install and can be handled without user-level programming due to extensive use of chemometrics and its association with applications that require purchased licenses or routines. The developed software, called Chemostat, employs Hierarchical Cluster Analysis (HCA), Principal Component Analysis (PCA), intervals Principal Component Analysis (iPCA), as well as correction methods, data transformation and outlier detection. The data can be imported from the clipboard, text files, ASCII or FT-IR Perkin-Elmer “.sp” files. It generates a variety of charts and tables that allow the analysis of results that can be exported in several formats. The main features of the software were tested using midinfrared and near-infrared spectra in vegetable oils and digital images obtained from different types of commercial diesel. In order to validate the software results, the same sets of data were analyzed using Matlab© and the results in both applications matched in various combinations. In addition to the desktop version, the reuse of algorithms allowed an online version to be provided that offers a unique experience on the web. Both applications are available in English.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Self-organizing maps (SOM) are artificial neural networks widely used in the data mining field, mainly because they constitute a dimensionality reduction technique given the fixed grid of neurons associated with the network. In order to properly the partition and visualize the SOM network, the various methods available in the literature must be applied in a post-processing stage, that consists of inferring, through its neurons, relevant characteristics of the data set. In general, such processing applied to the network neurons, instead of the entire database, reduces the computational costs due to vector quantization. This work proposes a post-processing of the SOM neurons in the input and output spaces, combining visualization techniques with algorithms based on gravitational forces and the search for the shortest path with the greatest reward. Such methods take into account the connection strength between neighbouring neurons and characteristics of pattern density and distances among neurons, both associated with the position that the neurons occupy in the data space after training the network. Thus, the goal consists of defining more clearly the arrangement of the clusters present in the data. Experiments were carried out so as to evaluate the proposed methods using various artificially generated data sets, as well as real world data sets. The results obtained were compared with those from a number of well-known methods existent in the literature

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Pós-graduação em Geociências e Meio Ambiente - IGCE

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Data Visualization is widely used to facilitate the comprehension of information and find relationships between data. One of the most widely used techniques for multivariate data (4 or more variables) visualization is the 2D scatterplot. This technique associates each data item to a visual mark in the following way: two variables are mapped to Cartesian coordinates so that a visual mark can be placed on the Cartesian plane; the others variables are mapped gradually to visual properties of the mark, such as size, color, shape, among others. As the number of variables to be visualized increases, the amount of visual properties associated to the mark increases as well. As a result, the complexity of the final visualization is higher. However, increasing the complexity of the visualization does not necessarily implies a better visualization and, sometimes, it provides an inverse situation, producing a visually polluted and confusing visualization—this problem is called visual properties overload. This work aims to investigate whether it is possible to work around the overload of the visual channel and improve insight about multivariate data visualized through a modification in the 2D scatterplot technique. In this modification, we map the variables from data items to multisensoriy marks. These marks are composed not only by visual properties, but haptic properties, such as vibration, viscosity and elastic resistance, as well. We believed that this approach could ease the insight process, through the transposition of properties from the visual channel to the haptic channel. The hypothesis was verified through experiments, in which we have analyzed (a) the accuracy of the answers; (b) response time; and (c) the grade of personal satisfaction with the proposed approach. However, the hypothesis was not validated. The results suggest that there is an equivalence between the investigated visual and haptic properties in all analyzed aspects, though in strictly numeric terms the multisensory visualization achieved better results in response time and personal satisfaction.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Dissertação apresentada como requisito parcial para obtenção do grau de Mestre em Estatística e Gestão de Informação.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

A metodologia desenvolvida pelo Minnesota Innovation Research Program para avaliação dos processos de inovação, denominada Minnesota Innovation Survey (MIS) serviu de base para a proposição de um modelo de análise de ambiente propício ao desenvolvimento de inovações. A necessidade da proposição de um novo modelo surgiu a partir da observação dos resultados de pesquisas que utilizaram a mesma metodologia, em que questões e dimensões se apresentavam altamente correlacionadas, gerando redundância de medição de construtos e pouca precisão nos resultados. Com isso buscou-se, por meio de embasamento teórico e estatística multivariada, reduzir o número de construtos afins no intuito de evitar a multicolinearidade e os resultados dúbios. A metodologia utilizada para o desenvolvimento do modelo proposto caracteriza-se como descritiva com método quantitativo. Foram aplicados questionários da metodologia MIS a 349 empregados de uma empresa metal mecânica. A aplicação do modelo original obedeceu a todos os passos prescritos, mostrando a aderência por meio de modelagem de equações estruturais. Como resultado verificou-se que a redução de dados proveniente dos testes estatísticos impactou significantes alterações na metodologia de base, caracterizando o surgimento de uma nova metodologia de análise pela diminuição de 70% dos dados multivariados. Conclui-se que a nova metodologia, apesar de eliminar 65 questões do instrumento de coleta de dados, não reduz seu poder de explicação e eficácia quanto às relações dos ambientes organizacionais com os resultados da inovação. Em termos de execução de pesquisa, o novo modelo facilita a coleta de dados, minimiza a dispersão do respondente no momento do preenchimento do questionário, aumentando a confiabilidade dos dados, fornece informações acuradas sobre o ambiente inovador e garante robustez de análise. Empresas podem beneficiar-se desse instrumento de pesquisa por ser de fácil aplicação, entendimento e análise.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Mosaicos de áreas úmidas fornecem hábitats para uma ampla gama de espécies de aves, que raramente se distribuem uniformemente dentro das mesmas. O cenário mundial atual do estudo de aves em áreas úmidas deixa bem claro que as metodologias para estudos quantitativos de aves em áreas úmidas ainda estão sendo criadas ou aperfeiçoadas. O mosaico formado pelas áreas úmidas do Banhado dos Pachecos é de reconhecida importância para a conservação de aves aquáticas, constituindo-se numa área ideal para estudos da avifauna. A presente dissertação tem como objetivo avaliar a estrutura espacial e sazonal da avifauna do Banhado dos Pachecos, tecer considerações sobre a conservação das aves aquáticas sob uma perspectiva de paisagem e testar a viabilidade de se utilizar amostragens matinais e vespertinas para análises de distribuição e abundância da avifauna. O Banhado dos Pachecos, juntamente com o Banhado Grande, formam o Sistema Banhado Grande. A amostragem da avifauna foi conduzida através de levantamentos qualitativos e quantitativos de modo a cobrir quatro estações climáticas: verão, outono, inverno e primavera. As amostragens qualitativas foram realizadas através de deslocamentos ad libitum entre e durante as amostragens quantitativas em todas as fisionomias. As amostragens quantitativas foram realizadas através de pontos de contagem, transecções e contagens totais. Riqueza, grupos funcionais de forrageio, grupos funcionais de nidificação, aves aquáticas, situação de ocorrência no Rio Grande do Sul, espécies ameaçadas de extinção e abundância foram os descritores utilizados para a caracterização da avifauna. A estatística empregada na análise dos dados multivariados baseou-se em métodos não-paramétricos de reamostragem através de aleatorização e “bootstrap”. Análises de agrupamentos foram realizadas para determinar a formação de grupos de fisionomias e análises de coordenadas principais foram realizadas para determinar se existia algum padrão de associação entre as diferentes fisionomias. Registraram-se 209 espécies de aves, vinte e e três grupos funcionais de forrageio, sete grupos funcionais de nidificação e 60 espécies de aves aquáticas e 11 espécies ameaçadas de extinção. Trinta e duas espécies apresentaram evidências discordantes da situação de ocorrência conhecida para o estado. Alguns fatores que poderiam ser fontes de viés para a interpretação das análises na presente dissertação foram abordados. A constância encontrada no conjunto de espécies da área de estudo pode refletir uma maior estabilidade ambiental. O alto número de grupos funcionais de forrageio e de nidificação registrados para a área de estudo sugere uma grande diversidade de recursos, reflexo da heterogeneidade entre as diferentes fisionomias. A origem de algumas espécies que se mostraram efetivamente migratórias, pois usaram a área de estudo em um período estacional bem definido, se mostra uma incógnita. Somente estudos extensivos e abrangentes poderão responder essas perguntas e propor medidas eficientes para a conservação tanto das áreas úmidas como das espécies que delas dependem. A restauração de um corredor de áreas úmidas entre o banhado dos Pachecos e o banhado Grande, juntamente com um manejo rotativo de cultivos de arroz parece ser a alternativa mais viável e conciliatória entre pontos de vista econômico e conservacionista para possibilitar o aumento da conectividade no Sistema Banhado Grande.

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Pós-graduação em Agronomia (Energia na Agricultura) - FCA

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Pós-graduação em Ciências Biológicas (Microbiologia Aplicada) - IBRC

Relevância:

60.00% 60.00%

Publicador:

Resumo:

Pós-graduação em Agronomia (Ciência do Solo) - FCAV

Relevância:

60.00% 60.00%

Publicador:

Resumo:

The objective of this paper is to relate the set of financial ratios that are directly related to the success of public traded companies using a methodological approach and the method of multivariate principal component analysis. This study consists in the use of profitability ratios, debt and liquidity, to define the relationship between financial ratios with the best public traded companies listed in the magazine Exame Melhores e Maiores of 2013. Multivariate analysis was used to reduce the dimensionality of multivariate data, making linear combinations of the original variables (financial ratios) and express the data in principal components that result in new variables that contains much of the original data. As a result, we got the optimal number of five principal components, and both represent 95.6% of the original data. Among of all financial ratios, we can highlight the direct relationship between profitability ratios for the first principal component, and the direct relationship between the liquidity ratios, both inversely related with non-capital participation rates and degree indebtedness to the second principal component

Relevância:

30.00% 30.00%

Publicador:

Resumo:

In this work calibration models were constructed to determine the content of total lipids and moisture in powdered milk samples. For this, used the near-infrared spectroscopy by diffuse reflectance, combined with multivariate calibration. Initially, the spectral data were submitted to correction of multiplicative light scattering (MSC) and Savitzsky-Golay smoothing. Then, the samples were divided into subgroups by application of hierarchical clustering analysis of the classes (HCA) and Ward Linkage criterion. Thus, it became possible to build regression models by partial least squares (PLS) that allowed the calibration and prediction of the content total lipid and moisture, based on the values obtained by the reference methods of Soxhlet and 105 ° C, respectively . Therefore, conclude that the NIR had a good performance for the quantification of samples of powdered milk, mainly by minimizing the analysis time, not destruction of the samples and not waste. Prediction models for determination of total lipids correlated (R) of 0.9955, RMSEP of 0.8952, therefore the average error between the Soxhlet and NIR was ± 0.70%, while the model prediction to content moisture correlated (R) of 0.9184, RMSEP, 0.3778 and error of ± 0.76%

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Pós-graduação em Matematica Aplicada e Computacional - FCT

Relevância:

30.00% 30.00%

Publicador:

Resumo:

Technological advances and the availability of computational resources have been facilitating the collection and processing of data. Thus, the natural tendency of the monitoring processes is the simultaneous control of various quality characteristics. In automated processes, observations are generally autocorrelated. Studies with univariate graph for processes have shown that the autocorrelation reduces the ability of this signal changes in the process. In this paper, we study the multivariate autocorrelated processes. Through simulations are obtained properties of graphs, monitoring the mean vector, the properties of graphs VMAX, in monitoring the covariance matrix, and the properties of graphs MCMAX, the simultaneous monitoring of mean vector and covariance matrix. Conclude that increasing the autocorrelation and the number of variables being monitored, reduces the power of the graphics in signal of a special cause