1000 resultados para Análise de agrupamentos


Relevância:

100.00% 100.00%

Publicador:

Resumo:

The main objective of this study is to apply recently developed methods of physical-statistic to time series analysis, particularly in electrical induction s profiles of oil wells data, to study the petrophysical similarity of those wells in a spatial distribution. For this, we used the DFA method in order to know if we can or not use this technique to characterize spatially the fields. After obtain the DFA values for all wells, we applied clustering analysis. To do these tests we used the non-hierarchical method called K-means. Usually based on the Euclidean distance, the K-means consists in dividing the elements of a data matrix N in k groups, so that the similarities among elements belonging to different groups are the smallest possible. In order to test if a dataset generated by the K-means method or randomly generated datasets form spatial patterns, we created the parameter Ω (index of neighborhood). High values of Ω reveals more aggregated data and low values of Ω show scattered data or data without spatial correlation. Thus we concluded that data from the DFA of 54 wells are grouped and can be used to characterize spatial fields. Applying contour level technique we confirm the results obtained by the K-means, confirming that DFA is effective to perform spatial analysis

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Currently, one of the biggest challenges for the field of data mining is to perform cluster analysis on complex data. Several techniques have been proposed but, in general, they can only achieve good results within specific areas providing no consensus of what would be the best way to group this kind of data. In general, these techniques fail due to non-realistic assumptions about the true probability distribution of the data. Based on this, this thesis proposes a new measure based on Cross Information Potential that uses representative points of the dataset and statistics extracted directly from data to measure the interaction between groups. The proposed approach allows us to use all advantages of this information-theoretic descriptor and solves the limitations imposed on it by its own nature. From this, two cost functions and three algorithms have been proposed to perform cluster analysis. As the use of Information Theory captures the relationship between different patterns, regardless of assumptions about the nature of this relationship, the proposed approach was able to achieve a better performance than the main algorithms in literature. These results apply to the context of synthetic data designed to test the algorithms in specific situations and to real data extracted from problems of different fields

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Pós-graduação em Biociências - FCLAS

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)

Relevância:

100.00% 100.00%

Publicador:

Resumo:

The main objective of this study is to apply recently developed methods of physical-statistic to time series analysis, particularly in electrical induction s profiles of oil wells data, to study the petrophysical similarity of those wells in a spatial distribution. For this, we used the DFA method in order to know if we can or not use this technique to characterize spatially the fields. After obtain the DFA values for all wells, we applied clustering analysis. To do these tests we used the non-hierarchical method called K-means. Usually based on the Euclidean distance, the K-means consists in dividing the elements of a data matrix N in k groups, so that the similarities among elements belonging to different groups are the smallest possible. In order to test if a dataset generated by the K-means method or randomly generated datasets form spatial patterns, we created the parameter Ω (index of neighborhood). High values of Ω reveals more aggregated data and low values of Ω show scattered data or data without spatial correlation. Thus we concluded that data from the DFA of 54 wells are grouped and can be used to characterize spatial fields. Applying contour level technique we confirm the results obtained by the K-means, confirming that DFA is effective to perform spatial analysis

Relevância:

70.00% 70.00%

Publicador:

Resumo:

Os solos submetidos aos sistemas de produção sem preparo estão sujeitos à compactação, provocada pelo tráfego de máquinas, tornando necessário o acompanhamento das alterações do ambiente físico, que, quando desfavorável, restringe o crescimento radicular, podendo reduzir a produtividade das culturas. O objetivo do trabalho foi avaliar o efeito de diferentes intensidades de compactação na qualidade física de um Latossolo Vermelho textura média, localizado em Jaboticabal (SP), sob cultivo de milho, usando métodos de estatística multivariada. O delineamento experimental foi inteiramente casualizado, com seis intensidades de compactação e quatro repetições. Foram coletadas amostras indeformadas do solo nas camadas de 0,02-0,05, 0,08-0,11 e 0,15-0,18 m para determinação da densidade do solo (Ds), na camada de 0-0,20 m. As características da cultura avaliadas foram: densidade radicular, diâmetro radicular, matéria seca das raízes, altura das plantas, altura de inserção da primeira espiga, diâmetro do colmo e matéria seca das plantas. As análises de agrupamentos e componentes principais permitiram identificar três grupos de alta, média e baixa produtividade de plantas de milho, segundo variáveis do solo, do sistema radicular e da parte aérea das plantas. A classificação dos acessos em grupos foi feita por três métodos: método de agrupamentos hierárquico, método não-hierárquico k-means e análise de componentes principais. Os componentes principais evidenciaram que elevadas produtividades de milho estão correlacionadas com o bom crescimento da parte aérea das plantas, em condições de menor densidade do solo, proporcionando elevada produção de matéria seca das raízes, contudo, de pequeno diâmetro. A qualidade física do Latossolo Vermelho para o cultivo do milho foi assegurada até à densidade do solo de 1,38 Mg m-3.

Relevância:

70.00% 70.00%

Publicador:

Resumo:

Com o objetivo de avaliar o comportamento de cinco cultivares de girassol em um Latossolo Vermelho argiloso, foram realizados quatro ensaios sob quatro níveis de saturação por bases (18%, 35%, 56% e 77%) obtidos com aplicação de calcário dolomítico. Os dados semanais de crescimento foram ajustados pelas funções logística, Weibull de três parâmetros e a logística generalizada de quatro parâmetros empregando-se o procedimento NLIN do SAS, bem como os processos interativos do método DUD. A função logística forneceu os melhores ajustes aos dados de crescimento. As cultivares foram categorizadas de acordo com o porte das plantas e tendências de crescimento a partir da análise de agrupamentos (cluster analysis), usando o método das ligações completas e a métrica da distância euclidiana. Todas as cultivares tiveram o crescimento reduzido quando o nível de saturação de bases foi de 18%. A cultivar M734 apresentou bom desempenho no nível de 35% de saturação por bases. Nos demais casos, os melhores resultados foram obtidos nos níveis de saturação por bases entre 56% e 77%. As cultivares EMBRAPA 122 e M738 tiveram redução de crescimento quando a saturação foi elevada para 77%. 'EMBRAPA 122' apresentou maior crescimento inicial e menor altura ao final do ciclo vegetativo.

Relevância:

70.00% 70.00%

Publicador:

Resumo:

O objetivo deste trabalho foi detalhar os ciclos de infecção da Phakopsora pachyrhizi Syd. & P. Syd. em genótipos de soja, para o estabelecimento de grupos de genótipos mais promissores para o uso como fontes de resistência à ferrugem. Os componentes do ciclo de infecção foram quantificados em 48 genótipos. Foram avaliados: tipo de lesão, intensidade de esporulação, severidade, número de lesões e de urédias e produtividade de urediniósporos. Pela análise de agrupamentos, formaram-se quatro grupos: A - desenvolveu a maior quantidade de doença; B - desenvolveu a menor quantidade de doença; C - baixa resistência inicial e D - alta resistência inicial. Os genótipos dos grupos B, C e D apresentaram lesões RB ("redish-brown") e variaram quanto à resistência inicial, resistência tardia, intensidade de esporulação, estabilidade da resposta qualitativa, produtividade de urediniósporos e número de dias para atingir 50% da severidade máxima. Entre as variáveis analisadas, as que apresentaram importância prática foram as avaliações das respostas qualitativas e as de severidade. Esta última reflete os efeitos combinados de resistência sobre todos os componentes da infecção e apresentam importância prática na diferenciação de genótipos, quanto à resistência à doença. Os genótipos dos grupos B, C e D manifestaram resistência qualitativa e quantitativa, em diferentes graus, e promissores para serem utilizados como fontes de genes de resistência à ferrugem-asiática-da-soja.

Relevância:

70.00% 70.00%

Publicador:

Resumo:

Em um pomar jovem de laranjeiras Hamlin, não-irrigado, foi realizado um estudo que procurou investigar a potencialidade da utilização de dados espaço-temporais de produção por árvore para o gerenciamento localizado. A produção de 1.471 árvores georreferenciadas foi levantada em dois ciclos sucessivos, 2000-2001 e 2001-2002, e classificada por meio de uma análise de agrupamentos via lógica fuzzy. Ainda, foi realizada uma análise de correlação intraclasse com dados de resposta espectral de 52 árvores, extraída de imagens aéreas multiespectrais de alta resolução espacial. Os resultados mostraram que foi possível a formação de classes distintas de comportamento produtivo, em função dos padrões de variabilidade espacial e temporal da produção. No entanto, as classes apresentaram baixa coerência espacial, o que dificulta o gerenciamento localizado da produção em nível de árvores individuais. A despeito disso, a resposta espectral esteve significativamente relacionada às classes formadas.

Relevância:

70.00% 70.00%

Publicador:

Resumo:

Este trabalho objetivou identificar as variáveis que se associam às injúrias pelo frio e determinar as diferenças nos parâmetros de qualidade que melhor caracterizam mangas 'Tommy Atkins' submetidas à condição de injúria pelo frio, utilizando-se da análise de fatores em componentes principais e a análise de agrupamentos. Frutos colhidos no estádio "de vez" foram cuidadosamente transportados, selecionados, padronizados quanto a coloração, tamanho e ausência de injúrias, e tratados com fungicida antes de serem armazenados a 2 ºC (74,8% UR), 5 °C (75,4% UR) e 12 °C (76,4% UR), por até 28 dias. Os frutos foram avaliados semanalmente quanto à ocorrência de danos pelo frio, coloração da casca e da polpa, firmeza da polpa, teores de sólidos solúveis, acidez titulável, açúcares solúveis e redutores, ácido ascórbico e atividade das enzimas peroxidase, polifenoloxidase e fenilalanina amônia-liase. A análise estatística multivariada dos fatores em componentes principais e agrupamentos permitiram melhor compreensão do efeito do armazenamento, sob condição de chilling, no metabolismo de mangas 'Tommy Atkins' e indicaram que o dano está intimamente relacionado com a casca e que a resposta da polpa ao estresse ocorre de forma tardia.

Relevância:

70.00% 70.00%

Publicador:

Resumo:

Foram analisadas amostras de quiabo dos municípios de Caruaru e Vitória de Santo Antão, em Pernambuco, assim como nos municípios de Ceará-Mirim, Macaíba e Extremoz no estado do Rio Grande do Norte. A aplicação de dois métodos de análise exploratória de dados: Análise de Componentes principais - PCA e Análise de Agrupamentos Hierárquicos - HCA permitiu a discriminação geográfica do quiabo proveniente dos dois estados.

Relevância:

70.00% 70.00%

Publicador:

Resumo:

O presente trabalho realizou uma análise de agrupamentos espacial por meio da estatística multivariada, no intuito de investigar a relação entre a produtividade da soja e as seguintes variáveis agrometeorológicas: precipitação pluvial, temperatura média do ar, radiação solar global e índice local de Moran (LISA) da produtividade. O estudo foi realizado com os dados das safras dos anos agrícolas de 2000/2001 a 2007/2008 da região oeste do Estado do Paraná. A identificação do número adequado de clusters para cada ano-safra foi obtida utilizando a minimização de desvios. O estudo mostrou a formação de grupos de municípios utilizando as similaridades das variáveis em análise. A análise de agrupamento foi um instrumento útil para melhor gestão das atividades de produção da agricultura, em função de que, com o agrupamento, foi possível estabelecer similaridades que proporcionem parâmetros para melhor gestão dos processos de produção que traga, quantitativa e qualitativamente, resultados almejados pelo agricultor.

Relevância:

70.00% 70.00%

Publicador:

Resumo:

Sistemas de recomendação baseados cooperação indireta podem ser implementados em bibliotecas por meio da aplicação de conceitos e procedimentos de análise de redes. Uma medida de distância temática, inicialmente desenvolvida para variáveis dicotômicas, foi generalizada e aplicada a matrizes de co-ocorrências, permitindo o aproveitando de toda a informação disponível sobre o comportamento dos usuários com relação aos itens consultados. Como resultado formaram-se subgrupos especializados altamente coerentes, para os quais listas-base e listas personalizadas foram geradas da maneira usual. Aplicativos programáveis capazes de manipularem matrizes, como o software S-plus, foram utilizados para os cálculos (com vantagens sobre o software especializado UCINET 5.0), sendo suficientes para o processamento de grupos temáticos de até 10.000 usuários.

Relevância:

70.00% 70.00%

Publicador:

Resumo:

Cada vez mais se reconhece que as diferentes categorias do orçamento familiar disputam recursos limitados de uma família. Isto sugere uma visão mais ampla e sistêmica de concorrência, já que os gastos dos consumidores em um determinado setor poderão ser melhor compreendidos se relacionados com os de outros setores. Faz sentido, então, concentrar estudos na própria manifestação do comportamento de compra, expressa pelo orçamento familiar, visto que as decisões mais prioritárias (vitais) estão estabelecidas na forma como o consumidor distribui seus recursos nas grandes categorias de despesa (alimentação, habitação, transporte, vestuário, lazer etc). Neste contexto delineia-se o principal objetivo desta tese que é investigar o fenômeno da alocação de despesas que compõem o orçamento familiar, identificando padrões, segmentos de mercado e suas implicações para o Marketing. O referencial teórico divide-se em três grandes partes: a segmentação de mercado, o orçamento familiar e os fatores econômicos e sócio-demográficos que se relacionam com o orçamento familiar. A clássica Hierarquia das Necessidades de Maslow é abordada, além de temas oriundos da literatura de economia como as Leis de Engel e elasticidade-renda da demanda. Utilizando dados de uma amostra de famílias do estado de São Paulo e valendo-se da técnica de análise de agrupamentos, a tese busca trazer um olhar mais influenciado pelos paradigmas do conhecimento mercadológico por meio da identificação e caracterização de segmentos de mercado com padrões distintos de orçamento familiar. Foi construída uma taxonomia composta por seis padrões assim nomeados: sobrevivência, enfermo, econômico, caseiro, bem-estar e automotor. A análise do perfil de cada padrão ressalta semelhanças e diferenças econômicas e sócio-demográficas que exigem a atenção dos pesquisadores e estrategistas de marketing quanto aos problemas de generalização, podendo resultar em erros nas estratégias de segmentação de mercado. Discussões dos resultados são tecidas a respeito da Teoria de Maslow e das Leis de Engel. Além disso, é proposta uma taxonomia de despesas familiares classificadas pelas elasticidades-renda entre os seis padrões de orçamento familiar identificados. Esta taxonomia ajuda a clarear as mudanças no comportamento de consumo segundo o impacto das alterações de renda na composição do orçamento familiar. Por fim, os resultados reforçam a tese de que padrões de alocação das despesas familiares se apresentam como uma dimensão inovadora e útil para os estudos de segmentação de mercado.

Relevância:

70.00% 70.00%

Publicador:

Resumo:

In recent years, the DFA introduced by Peng, was established as an important tool capable of detecting long-range autocorrelation in time series with non-stationary. This technique has been successfully applied to various areas such as: Econophysics, Biophysics, Medicine, Physics and Climatology. In this study, we used the DFA technique to obtain the Hurst exponent (H) of the profile of electric density profile (RHOB) of 53 wells resulting from the Field School of Namorados. In this work we want to know if we can or not use H to spatially characterize the spatial data field. Two cases arise: In the first a set of H reflects the local geology, with wells that are geographically closer showing similar H, and then one can use H in geostatistical procedures. In the second case each well has its proper H and the information of the well are uncorrelated, the profiles show only random fluctuations in H that do not show any spatial structure. Cluster analysis is a method widely used in carrying out statistical analysis. In this work we use the non-hierarchy method of k-means. In order to verify whether a set of data generated by the k-means method shows spatial patterns, we create the parameter Ω (index of neighborhood). High Ω shows more aggregated data, low Ω indicates dispersed or data without spatial correlation. With help of this index and the method of Monte Carlo. Using Ω index we verify that random cluster data shows a distribution of Ω that is lower than actual cluster Ω. Thus we conclude that the data of H obtained in 53 wells are grouped and can be used to characterize space patterns. The analysis of curves level confirmed the results of the k-means