974 resultados para análise de agrupamentos
The main objective of this study is to apply recently developed methods of physical-statistic to time series analysis, particularly in electrical induction s profiles of oil wells data, to study the petrophysical similarity of those wells in a spatial distribution. For this, we used the DFA method in order to know if we can or not use this technique to characterize spatially the fields. After obtain the DFA values for all wells, we applied clustering analysis. To do these tests we used the non-hierarchical method called K-means. Usually based on the Euclidean distance, the K-means consists in dividing the elements of a data matrix N in k groups, so that the similarities among elements belonging to different groups are the smallest possible. In order to test if a dataset generated by the K-means method or randomly generated datasets form spatial patterns, we created the parameter Ω (index of neighborhood). High values of Ω reveals more aggregated data and low values of Ω show scattered data or data without spatial correlation. Thus we concluded that data from the DFA of 54 wells are grouped and can be used to characterize spatial fields. Applying contour level technique we confirm the results obtained by the K-means, confirming that DFA is effective to perform spatial analysis
Currently, one of the biggest challenges for the field of data mining is to perform cluster analysis on complex data. Several techniques have been proposed but, in general, they can only achieve good results within specific areas providing no consensus of what would be the best way to group this kind of data. In general, these techniques fail due to non-realistic assumptions about the true probability distribution of the data. Based on this, this thesis proposes a new measure based on Cross Information Potential that uses representative points of the dataset and statistics extracted directly from data to measure the interaction between groups. The proposed approach allows us to use all advantages of this information-theoretic descriptor and solves the limitations imposed on it by its own nature. From this, two cost functions and three algorithms have been proposed to perform cluster analysis. As the use of Information Theory captures the relationship between different patterns, regardless of assumptions about the nature of this relationship, the proposed approach was able to achieve a better performance than the main algorithms in literature. These results apply to the context of synthetic data designed to test the algorithms in specific situations and to real data extracted from problems of different fields
Pós-graduação em Biociências - FCLAS
Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
The main objective of this study is to apply recently developed methods of physical-statistic to time series analysis, particularly in electrical induction s profiles of oil wells data, to study the petrophysical similarity of those wells in a spatial distribution. For this, we used the DFA method in order to know if we can or not use this technique to characterize spatially the fields. After obtain the DFA values for all wells, we applied clustering analysis. To do these tests we used the non-hierarchical method called K-means. Usually based on the Euclidean distance, the K-means consists in dividing the elements of a data matrix N in k groups, so that the similarities among elements belonging to different groups are the smallest possible. In order to test if a dataset generated by the K-means method or randomly generated datasets form spatial patterns, we created the parameter Ω (index of neighborhood). High values of Ω reveals more aggregated data and low values of Ω show scattered data or data without spatial correlation. Thus we concluded that data from the DFA of 54 wells are grouped and can be used to characterize spatial fields. Applying contour level technique we confirm the results obtained by the K-means, confirming that DFA is effective to perform spatial analysis
Sistemas de recomendação baseados cooperação indireta podem ser implementados em bibliotecas por meio da aplicação de conceitos e procedimentos de análise de redes. Uma medida de distância temática, inicialmente desenvolvida para variáveis dicotômicas, foi generalizada e aplicada a matrizes de co-ocorrências, permitindo o aproveitando de toda a informação disponível sobre o comportamento dos usuários com relação aos itens consultados. Como resultado formaram-se subgrupos especializados altamente coerentes, para os quais listas-base e listas personalizadas foram geradas da maneira usual. Aplicativos programáveis capazes de manipularem matrizes, como o software S-plus, foram utilizados para os cálculos (com vantagens sobre o software especializado UCINET 5.0), sendo suficientes para o processamento de grupos temáticos de até 10.000 usuários.
Cada vez mais se reconhece que as diferentes categorias do orçamento familiar disputam recursos limitados de uma família. Isto sugere uma visão mais ampla e sistêmica de concorrência, já que os gastos dos consumidores em um determinado setor poderão ser melhor compreendidos se relacionados com os de outros setores. Faz sentido, então, concentrar estudos na própria manifestação do comportamento de compra, expressa pelo orçamento familiar, visto que as decisões mais prioritárias (vitais) estão estabelecidas na forma como o consumidor distribui seus recursos nas grandes categorias de despesa (alimentação, habitação, transporte, vestuário, lazer etc). Neste contexto delineia-se o principal objetivo desta tese que é investigar o fenômeno da alocação de despesas que compõem o orçamento familiar, identificando padrões, segmentos de mercado e suas implicações para o Marketing. O referencial teórico divide-se em três grandes partes: a segmentação de mercado, o orçamento familiar e os fatores econômicos e sócio-demográficos que se relacionam com o orçamento familiar. A clássica Hierarquia das Necessidades de Maslow é abordada, além de temas oriundos da literatura de economia como as Leis de Engel e elasticidade-renda da demanda. Utilizando dados de uma amostra de famílias do estado de São Paulo e valendo-se da técnica de análise de agrupamentos, a tese busca trazer um olhar mais influenciado pelos paradigmas do conhecimento mercadológico por meio da identificação e caracterização de segmentos de mercado com padrões distintos de orçamento familiar. Foi construída uma taxonomia composta por seis padrões assim nomeados: sobrevivência, enfermo, econômico, caseiro, bem-estar e automotor. A análise do perfil de cada padrão ressalta semelhanças e diferenças econômicas e sócio-demográficas que exigem a atenção dos pesquisadores e estrategistas de marketing quanto aos problemas de generalização, podendo resultar em erros nas estratégias de segmentação de mercado. Discussões dos resultados são tecidas a respeito da Teoria de Maslow e das Leis de Engel. Além disso, é proposta uma taxonomia de despesas familiares classificadas pelas elasticidades-renda entre os seis padrões de orçamento familiar identificados. Esta taxonomia ajuda a clarear as mudanças no comportamento de consumo segundo o impacto das alterações de renda na composição do orçamento familiar. Por fim, os resultados reforçam a tese de que padrões de alocação das despesas familiares se apresentam como uma dimensão inovadora e útil para os estudos de segmentação de mercado.
In recent years, the DFA introduced by Peng, was established as an important tool capable of detecting long-range autocorrelation in time series with non-stationary. This technique has been successfully applied to various areas such as: Econophysics, Biophysics, Medicine, Physics and Climatology. In this study, we used the DFA technique to obtain the Hurst exponent (H) of the profile of electric density profile (RHOB) of 53 wells resulting from the Field School of Namorados. In this work we want to know if we can or not use H to spatially characterize the spatial data field. Two cases arise: In the first a set of H reflects the local geology, with wells that are geographically closer showing similar H, and then one can use H in geostatistical procedures. In the second case each well has its proper H and the information of the well are uncorrelated, the profiles show only random fluctuations in H that do not show any spatial structure. Cluster analysis is a method widely used in carrying out statistical analysis. In this work we use the non-hierarchy method of k-means. In order to verify whether a set of data generated by the k-means method shows spatial patterns, we create the parameter Ω (index of neighborhood). High Ω shows more aggregated data, low Ω indicates dispersed or data without spatial correlation. With help of this index and the method of Monte Carlo. Using Ω index we verify that random cluster data shows a distribution of Ω that is lower than actual cluster Ω. Thus we conclude that the data of H obtained in 53 wells are grouped and can be used to characterize space patterns. The analysis of curves level confirmed the results of the k-means
Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)
Nesta pesquisa objetivou-se captar a variedade de situações tecnológicas para identificar grupos de produtores, o mais semelhante possível, no conjunto de variáveis e características selecionadas. Foram considerados 72 produtores, 8,33% da amostra total, selecionados conforme 29 variáveis relacionadas a fatores produtivos. Avaliaram-se as variáveis de melhor representatividade dentro de cada fator e suas comunalidades dentro do conjunto de fatores analisados. Para a avaliação desses resultados, foram utilizados métodos de análise fatorial em componentes principais. Posteriormente, aplicou-se o método de análise de agrupamentos. O pluralismo tecnológico requer análises de agrupamento para viabilizar intervenções técnicas diferenciadas, o que permite a consolidação de condições de sustentabilidade a partir das reais necessidades de incorporação tecnológica dos produtores.
Peng was the first to work with the Technical DFA (Detrended Fluctuation Analysis), a tool capable of detecting auto-long-range correlation in time series with non-stationary. In this study, the technique of DFA is used to obtain the Hurst exponent (H) profile of the electric neutron porosity of the 52 oil wells in Namorado Field, located in the Campos Basin -Brazil. The purpose is to know if the Hurst exponent can be used to characterize spatial distribution of wells. Thus, we verify that the wells that have close values of H are spatially close together. In this work we used the method of hierarchical clustering and non-hierarchical clustering method (the k-mean method). Then compare the two methods to see which of the two provides the best result. From this, was the parameter � (index neighborhood) which checks whether a data set generated by the k- average method, or at random, so in fact spatial patterns. High values of � indicate that the data are aggregated, while low values of � indicate that the data are scattered (no spatial correlation). Using the Monte Carlo method showed that combined data show a random distribution of � below the empirical value. So the empirical evidence of H obtained from 52 wells are grouped geographically. By passing the data of standard curves with the results obtained by the k-mean, confirming that it is effective to correlate well in spatial distribution
The objective of this work was to study the dimensional parameters of the drainage net using 12 third-order ramification hydrological watersheds: 4 watersheds per soil unit (LVA, RL and RQ). The soil distinction was realized using ''t'' test to verify the orthogonal contrast among three soil averages and the grouping analysis and mean components. The results showed that the multivariance analysis was not able to discriminate three soils using the dimensional analysis. The t test of this isolated variable allowed discriminating RQ soil from LVA and RL soil units; but it was not sensitive to discriminate the LVA soil and RL unit.
The objective of the study was to analyze the features of the relief through the variables: maximum altitude (HM); mean altitude (Hmd); minimum altitude (Hm); altitude range (H); average slope length (CVm); minimum length of run-off (Cd) and average steepness of circular samples (I) of the Capivara River Watershed – Botucatu (SP). A total of 4 circular samples were obtained per unit of soil (Quartzipsamment alfisol oxisol - RQ, Udox - LVA and Udorthent - RL). Multivariable analysis and aerial color photographs of 2000, Brazilian Chart and Soil Chart of Botucatu city-SP were used for data analyses. Soil differentiation was performed using the Student-t Test for analyzes of orthogonal contrasts among means of the three soils and analysis of groupings and major components. The grouping analysis of the variables of relief differentiated 75% of LVA and 100% of RL and RQ soil circular samples. The most efficient parameters of relief for differentiation of soils according to their order of importance were as follows: HM, Hm, Hmd and H.
Pós-graduação em Fisiopatologia em Clínica Médica - FMB
Este estudo tem como objetivo principal confirmar definição conceitual apresentada pela Bovespa e o mercado financeiro brasileiro dos perfis dos fundos de investimentos brasileiros adotando como técnica estatística a análise de agrupamentos, sendo que os perfis são: agressivo, moderado e conservador. Outro objetivo foi verificar se a crise financeira mundial interferiu nos resultados dos fundos de investimentos. Essa pesquisa permite compreender o perfil dos fundos de investimentos ofertados no mercado financeiro brasileiro e também disponibilizar a aproximação da academia com o mercado. Os fundos de investimentos foram selecionados do banco de dados da empresa Quantum Axis, sendo que, extraiu-se uma população contendo 104 fundos de investimentos. A pesquisa divide-se em 6 análises, sendo que a sexta análise compreende o intervalo de tempo de 02/12/2003 à 28/11/2008 e as outras 5 são intervalos anuais. As observações da população do estudo são taxas efetivas diárias de retorno. Utiliza-se a variável risco e a variável retorno dos fundos de investimentos para formação dos grupos. Nas análises de agrupamentos adota-se o método de aglomeração k-médias. Calcula-se o risco pelo desvio padrão e o retorno pela média aritmética dos fundos de investimentos. A pesquisa mostra que os fundos de investimentos ofertados no mercado financeiro brasileiro foram classificados em três perfis diferentes, observa-se também que os resultados dos fundos de investimentos foram afetados pela crise financeira mundial.(AU)