918 resultados para Distância euclidiana
Resumo:
Os métodos espectrais são ferramentas úteis na análise de dados, sendo capazes de fornecer informações sobre a estrutura organizacional de dados. O agrupamento de dados utilizando métodos espectrais é comumente baseado em relações de similaridade definida entre os dados. O objetivo deste trabalho é estudar a capacidade de agrupamento de métodos espectrais e seu comportamento, em casos limites. Considera-se um conjunto de pontos no plano e usa-se a similaridade entre os nós como sendo o inverso da distância Euclidiana. Analisa-se a qual distância mínima, entre dois pontos centrais, o agrupamento espectral é capaz de reagrupar os dados em dois grupos distintos. Acessoriamente, estuda-se a capacidade de reagrupamento caso a dispersão entre os dados seja aumentada. Inicialmente foram realizados experimentos considerando uma distância fixa entre dois pontos, a partir dos quais os dados são gerados e, então, reduziu-se a distância entre estes pontos até que o método se tornasse incapaz de efetuar a separação dos pontos em dois grupos distintos. Em seguida, retomada a distância inicial, os dados foram gerados a partir da adição de uma perturbação normal, com variância crescente, e observou-se até que valor de variância o método fez a separação dos dados em dois grupos distintos de forma correta. A partir de um conjunto de pontos obtidos com a execução do algoritmo de evolução diferencial, para resolver um problema multimodal, testa-se a capacidade do método em separar os indivíduos em grupos diferentes.
Resumo:
A Área de Proteção Ambiental de Massambaba concentra diversas formações vegetais com uma grande riqueza florística e endemismos. Infelizmente esta área está sujeita à ação antrópica tanto que alguns fragmentos se encontram degradados. Para recuperar ecologicamente esta vegetação é importante compreender os mecanismos de sucessão ecológica. Como se sabe pouco sobre interações entre plantas de restinga, e menos ainda sob o prisma da alelopatia (efeito negativo que uma planta exerce em outras, ao liberar metabólitos secundários para o seu entorno),objetivou-se a realização de ensaios biológicos com espécies nativas. Inicialmente determinamos as melhores condições de extração de metabólitos, e por fim realizamos bioensaios com 18 espécies (Allagoptera aenaria, Andira legalis, Byrsonima sericea, Clusia fluminensis, Couepia ovalifolia, Erythroxylum ovalifolium, Eugenia copacabanensis, Eugenia selloi, Garcinia brasiliensis, Guapira opposita, Maytenus obtusifolia, Myrsine parvifolia, Neomitranthes obscura, Ocotea notata, Pouteria caimito, Renvoizea trinii, Tocoyena bullata e Vitex megapotamica). A aplicação dos extratos foi sobrea germinação e ocrescimento inicial de sementes de alface. Para isso, folhas destas espécies foram coletadas sazonalmente na formação arbustiva aberta não inundável (fácies alta) na restinga de Massambaba para o preparo de extratos aquosos. Os extratos foram obtidos a através da secagem das folhas à60C para posterior maceração, aquecimento, diluição e filtração, obtendo-se as concentrações de 5 e 10% de concentração (peso/volume). Os parâmetros para avaliar a fitotoxidez foram:a porcentagem ea velocidade de germinação e o comprimento da raiz após sete dias de crescimento em placas de Petri umedecidas com os extratos. Além desses três parâmetros, foi utilizado o índice de efeito global, que transforma as três variáveis em um índice único e uma analise de agrupamento (distância euclidiana, método de Ward) para classificá-las em espécies de fraca, média ou alta fitotoxidez de acordo com o valor do índice. A inibição do crescimento foi observada em todas as espécies, e verificou-se diferenças sazonais significativas, com destaque no inverno. Isso sugere que as diferenças os entre níveis de fitotoxidez estejam correlacionada são ambiente e à genética. Se a ação inibitória das espécies com maior efeito alelopático for comprovada, novas estratégias podem ser elaboradas para a reintrodução em projetos de conservação ambiental
Resumo:
Um dos problemas emergentes na Agricultura de Precisão é a interpretação de mapas de produtividade. Como avaliar suas similaridades? Seria somente sua comparação visual ou através de técnicas analíticas? O objetivo do presente relatório foi introduzir a Análise Multivariada de Correspondência como um método estatístico que pode auxiliar na interpretaçao analítica de mapas de produtividade. Com isto pretende-se levantar a hipótese de que a utilização destes mapas para delimitar regiões homogêneas no campo depende da estabilidade espacial e temporal desta variável, tornando-se preocupante seu uso indiscriminado como ferramenta de informação preditiva. Quatro mapas foram usados neste trabalho, os quais correspondem a amostras coletadas de componentes de produção para arroz em 1994, milho em 1995, algodão em 1996, em uma malha com 110 pontos, espaçados de 10 x 10 m., da estação experimental do Instituto Agronômico de Campinas em Votuporanda, SP. Os dados originais de produtividade foram categorizados e analisados usando a Análise de Correspondência Simples e Múltipla. Conclui-se que existe uma grande dissimilaridade entre as culturas ou as classes de culturas, medidas através da distância euclidiana no plano.
Resumo:
Nos últimos anos temos vindo a assistir a uma mudança na forma como a informação é disponibilizada online. O surgimento da web para todos possibilitou a fácil edição, disponibilização e partilha da informação gerando um considerável aumento da mesma. Rapidamente surgiram sistemas que permitem a coleção e partilha dessa informação, que para além de possibilitarem a coleção dos recursos também permitem que os utilizadores a descrevam utilizando tags ou comentários. A organização automática dessa informação é um dos maiores desafios no contexto da web atual. Apesar de existirem vários algoritmos de clustering, o compromisso entre a eficácia (formação de grupos que fazem sentido) e a eficiência (execução em tempo aceitável) é difícil de encontrar. Neste sentido, esta investigação tem por problemática aferir se um sistema de agrupamento automático de documentos, melhora a sua eficácia quando se integra um sistema de classificação social. Analisámos e discutimos dois métodos baseados no algoritmo k-means para o clustering de documentos e que possibilitam a integração do tagging social nesse processo. O primeiro permite a integração das tags diretamente no Vector Space Model e o segundo propõe a integração das tags para a seleção das sementes iniciais. O primeiro método permite que as tags sejam pesadas em função da sua ocorrência no documento através do parâmetro Social Slider. Este método foi criado tendo por base um modelo de predição que sugere que, quando se utiliza a similaridade dos cossenos, documentos que partilham tags ficam mais próximos enquanto que, no caso de não partilharem, ficam mais distantes. O segundo método deu origem a um algoritmo que denominamos k-C. Este para além de permitir a seleção inicial das sementes através de uma rede de tags também altera a forma como os novos centróides em cada iteração são calculados. A alteração ao cálculo dos centróides teve em consideração uma reflexão sobre a utilização da distância euclidiana e similaridade dos cossenos no algoritmo de clustering k-means. No contexto da avaliação dos algoritmos foram propostos dois algoritmos, o algoritmo da “Ground truth automática” e o algoritmo MCI. O primeiro permite a deteção da estrutura dos dados, caso seja desconhecida, e o segundo é uma medida de avaliação interna baseada na similaridade dos cossenos entre o documento mais próximo de cada documento. A análise de resultados preliminares sugere que a utilização do primeiro método de integração das tags no VSM tem mais impacto no algoritmo k-means do que no algoritmo k-C. Além disso, os resultados obtidos evidenciam que não existe correlação entre a escolha do parâmetro SS e a qualidade dos clusters. Neste sentido, os restantes testes foram conduzidos utilizando apenas o algoritmo k-C (sem integração de tags no VSM), sendo que os resultados obtidos indicam que a utilização deste algoritmo tende a gerar clusters mais eficazes.
Resumo:
O objetivo desta dissertação foi estudar um conjunto de empresas cotadas na bolsa de valores de Lisboa, para identificar aquelas que têm um comportamento semelhante ao longo do tempo. Para isso utilizamos algoritmos de Clustering tais como K-Means, PAM, Modelos hierárquicos, Funny e C-Means tanto com a distância euclidiana como com a distância de Manhattan. Para selecionar o melhor número de clusters identificado por cada um dos algoritmos testados, recorremos a alguns índices de avaliação/validação de clusters como o Davies Bouldin e Calinski-Harabasz entre outros.
Resumo:
Este trabalho versa sobre a avaliação da compressão de dados e da qualidade de imagens e animações usando-se complexidade de Kolmogorov, simulação de máquinas e distância de informação. Complexidade de Kolmogorov é uma teoria da informação e da aleatoriedade baseada na máquina de Turing. No trabalho é proposto um método para avaliar a compressão de dados de modelos de animação gráfica usando-se simulação de máquinas. Também definimos formalmente compressão de dados com perdas e propomos a aplicação da distância de informação como uma métrica de qualidade de imagem. O desenvolvimento de uma metodologia para avaliar a compressão de dados de modelos de animação gráfica para web é útil, a medida que as páginas na web estão sendo cada vez mais enriquecidas com animações, som e vídeo, e a economia de banda de canal tornase importante, pois os arquivos envolvidos são geralmente grandes. Boa parte do apelo e das vantagens da web em aplicações como, por exemplo, educação à distância ou publicidade, reside exatamente na existência de elementos multimídia, que apoiam a idéia que está sendo apresentada na página. Como estudo de caso, o método de comparação e avaliação de modelos de animação gráfica foi aplicado na comparação de dois modelos: GIF (Graphics Interchange Format) e AGA (Animação Gráfica baseada em Autômatos finitos), provando formalmente que AGA é melhor que GIF (“melhor” significa que AGA comprime mais as animações que GIF). Foi desenvolvida também uma definição formal de compressão de dados com perdas com o objetivo de estender a metodologia de avalição apresentada Distância de informação é proposta como uma nova métrica de qualidade de imagem, e tem como grande vantagem ser uma medida universal, ou seja, capaz de incorporar toda e qualquer medida computável concebível. A métrica proposta foi testada em uma série de experimentos e comparada com a distância euclidiana (medida tradicionalmente usada nestes casos). Os resultados dos testes são uma evidência prática que a distância proposta é efetiva neste novo contexto de aplicação, e que apresenta, em alguns casos, resultados superiores ao da distância euclidiana. Isto também é uma evidência que a distância de informação é uma métrica mais fina que a distância euclidiana. Também mostramos que há casos em que podemos aplicar a distância de informação, mas não podemos aplicar a distância euclidiana. A métrica proposta foi aplicada também na avaliação de animações gráficas baseadas em frames, onde apresentou resultados melhores que os obtidos com imagens puras. Este tipo de avaliação de animações é inédita na literatura, segundo revisão bibliográfica feita. Finalmente, neste trabalho é apresentado um refinamento à medida proposta que apresentou resultados melhores que a aplicação simples e direta da distância de informação.
Resumo:
Foi realizado um estudo sobre a situação ambiental numa micro bacia hidrográfica, utilizando o Sensoriamento Remoto e outras fontes como técnica de obtenção e tratamento dos dados. Com o recurso das classificações de imagens digitais, através de um procedimento não-supervisionado e de outro supervisionado, utilizando, respectivamente os métodos da Distância Euclidiana e da Máxima Verossimilhança, foi identificado o uso efetivo aplicado à terra na data de tomada da imagem, de cujo resultado obteve-se um documento cartográfico que representa o uso antrópico da área. Através da identificação das características físicas locais, com base na interpretação visual dos produtos do Sensoriamento Remoto, imagens TM e fotografias aéreas, e de outras fontes, foi feita a identificação do emprego mais adequado a ser aplicado à terra, a qual gerou um outro documento cartográfico representativo. Do cruzamento das informações contidas nas etapas anteriormente descritas, foi realizada uma análise ambiental da área em estudo, a qual também gerou um mapa temático que a representa.
Resumo:
Com o objetivo de conhecer a composição florística, a fitossociologia e a dinâmica vegetacional em parcelas de campos limpos do sudoeste do RS, foi desenvolvido um estudo em uma área de campo nativo submetido a pastejo contínuo. A área de estudo está situada ao longo dos sedimentos de fundo de vale da encosta de um morro tabular, no município de São Francisco de Assis, RS. Nesta área foram delimitadas duas subáreas com diferentes características com relação ao processo de arenização: subárea 01, com arenização, e subárea 02, sem ocorrência do processo. Para a florística, as subáreas foram percorridas de fevereiro de 2004 a junho de 2005, quando foi coletado material em estágio reprodutivo. Foram listadas 77 espécies pertencentes a 22 famílias na subárea 01 e 86 espécies pertencentes a 24 famílias na subárea 02. Para a fitossociologia foram inventariadas 35 unidades amostrais permanentes, de 0,25 m², em cada subárea. Foi registrada a cobertura de todas as espécies vegetais vasculares, mantilho e solo exposto em setembro de 2004, janeiro e maio de 2005 nas duas subáreas. Nos três levantamentos da subárea 01, solo exposto, Paspalum stellatum H. & B. ex Fl. e P. nicorae Parodi, detiveram as maiores coberturas e, na subárea 02, foram solo exposto, P. nicorae e P. stellatum. Foi avaliada a cobertura das espécies, do solo exposto e mantilho, considerando o tempo e a distância da encosta como fatores de variação. A estes valores foi aplicada a análise de variância univariada com testes de aleatorização, através da Distância Euclidiana. Os resultados indicam uma redução progressiva da diversidade específica e da cobertura vegetal e aumento de solo exposto na subárea 01 ao considerar o fator tempo. Na subárea 02, o aumento da cobertura de solo exposto e a redução da cobertura vegetal ocorreram tanto ao considerar o fator tempo quanto à distância da encosta, porém com menor intensidade. A ocorrência de picos com precipitação elevada de janeiro de 2004 a junho de 2005, associada à chuvas torrenciais, seguidos de períodos com redução significativa na precipitação, influenciaram diretamente na alteração da cobertura vegetal e na ocorrência da arenização na subárea 01. Identifica-se, também, que na subárea 01 os baixos índices de matéria orgânica e argila, baixa capacidade de trocas catiônicas, baixo índice de saturação de bases, reduzida disponibilidade de P (fósforo), K (potássio) e Mg (magnésio) e alta saturação de Al (alumínio) influenciam as dinâmicas da cobertura vegetal. Essas características imprimem ao solo da subárea 01 maior tendência à lixiviação, um dos fatores determinantes para a ocorrência da arenização. O solo da subárea 02, ao contrário, apresenta características que favorecem o desenvolvimento da vegetação e contribuem para a maior estabilidade do sistema local.
Resumo:
The main objective of this study is to apply recently developed methods of physical-statistic to time series analysis, particularly in electrical induction s profiles of oil wells data, to study the petrophysical similarity of those wells in a spatial distribution. For this, we used the DFA method in order to know if we can or not use this technique to characterize spatially the fields. After obtain the DFA values for all wells, we applied clustering analysis. To do these tests we used the non-hierarchical method called K-means. Usually based on the Euclidean distance, the K-means consists in dividing the elements of a data matrix N in k groups, so that the similarities among elements belonging to different groups are the smallest possible. In order to test if a dataset generated by the K-means method or randomly generated datasets form spatial patterns, we created the parameter Ω (index of neighborhood). High values of Ω reveals more aggregated data and low values of Ω show scattered data or data without spatial correlation. Thus we concluded that data from the DFA of 54 wells are grouped and can be used to characterize spatial fields. Applying contour level technique we confirm the results obtained by the K-means, confirming that DFA is effective to perform spatial analysis
Resumo:
The Northeast of Brazil (NEB) shows high climate variability, ranging from semiarid regions to a rainy regions. According to the latest report of the Intergovernmental Panel on Climate Change, the NEB is highly susceptible to climate change, and also heavy rainfall events (HRE). However, few climatology studies about these episodes were performed, thus the objective main research is to compute the climatology and trend of the episodes number and the daily rainfall rate associated with HRE in the NEB and its climatologically homogeneous sub regions; relate them to the weak rainfall events and normal rainfall events. The daily rainfall data of the hydrometeorological network managed by the Agência Nacional de Águas, from 1972 to 2002. For selection of rainfall events used the technique of quantiles and the trend was identified using the Mann-Kendall test. The sub regions were obtained by cluster analysis, using as similarity measure the Euclidean distance and Ward agglomerative hierarchical method. The results show that the seasonality of the NEB is being intensified, i.e., the dry season is becoming drier and wet season getting wet. The El Niño and La Niña influence more on the amount of events regarding the intensity, but the sub-regions this influence is less noticeable. Using daily data reanalysis ERAInterim fields of anomalies of the composites of meteorological variables were calculated for the coast of the NEB, to characterize the synoptic environment. The Upper-level cyclonic vortex and the South atlantic convergene zone were identified as the main weather systems responsible for training of EPI on the coastland
Resumo:
Objetivou-se neste trabalho a obtenção de padrões de infestação de plantas daninhas na cultura de cana-de-açúcar com histórico de colheita mecanizada sem queima prévia da palha. Foram realizadas amostragens em 28 talhões na região de Ribeirão Preto, SP; em cada talhão foram demarcadas unidades de avaliação e coleta, na proporção de duas por hectare, que consistiram de áreas (quatro linhas de 4 metros de comprimento) mantidas sem controle de plantas daninhas e onde foram realizadas as amostragens de plantas emergidas. As amostragens foram realizadas aos 120 dias após o corte, com quadrados vazados (0,5 x 0,5 m) lançados aleatoriamente duas vezes em cada uma das unidades de avaliação e coleta. Com os dados obtidos, calculou-se a importância relativa e o índice de agregação das espécies ou grupo de espécies. Esses índices foram usados no processamento da análise de agrupamento hierárquica, utilizando como medida de semelhança a distância euclidiana e como estratégia de agrupamento o método UPGMA (Unweighted Pair-Group Method using arithmetic Averages). Foi possível distinguir quatro grupos em função da importância relativa e cinco grupos de talhões em função do índice de agregação; dentro de alguns grupos houve formação de subgrupos.
Resumo:
The precision and the fast identification of abnormalities of bottom hole are essential to prevent damage and increase production in the oil industry. This work presents a study about a new automatic approach to the detection and the classification of operation mode in the Sucker-rod Pumping through dynamometric cards of bottom hole. The main idea is the recognition of the well production status through the image processing of the bottom s hole dynamometric card (Boundary Descriptors) and statistics and similarity mathematics tools, like Fourier Descriptor, Principal Components Analysis (PCA) and Euclidean Distance. In order to validate the proposal, the Sucker-Rod Pumping system real data are used
Resumo:
The complex behavior of a wide variety of phenomena that are of interest to physicists, chemists, and engineers has been quantitatively characterized by using the ideas of fractal and multifractal distributions, which correspond in a unique way to the geometrical shape and dynamical properties of the systems under study. In this thesis we present the Space of Fractals and the methods of Hausdorff-Besicovitch, box-counting and Scaling to calculate the fractal dimension of a set. In this Thesis we investigate also percolation phenomena in multifractal objects that are built in a simple way. The central object of our analysis is a multifractal object that we call Qmf . In these objects the multifractality comes directly from the geometric tiling. We identify some differences between percolation in the proposed multifractals and in a regular lattice. There are basically two sources of these differences. The first is related to the coordination number, c, which changes along the multifractal. The second comes from the way the weight of each cell in the multifractal affects the percolation cluster. We use many samples of finite size lattices and draw the histogram of percolating lattices against site occupation probability p. Depending on a parameter, ρ, characterizing the multifractal and the lattice size, L, the histogram can have two peaks. We observe that the probability of occupation at the percolation threshold, pc, for the multifractal is lower than that for the square lattice. We compute the fractal dimension of the percolating cluster and the critical exponent β. Despite the topological differences, we find that the percolation in a multifractal support is in the same universality class as standard percolation. The area and the number of neighbors of the blocks of Qmf show a non-trivial behavior. A general view of the object Qmf shows an anisotropy. The value of pc is a function of ρ which is related to its anisotropy. We investigate the relation between pc and the average number of neighbors of the blocks as well as the anisotropy of Qmf. In this Thesis we study likewise the distribution of shortest paths in percolation systems at the percolation threshold in two dimensions (2D). We study paths from one given point to multiple other points
Resumo:
The complex behavior of a wide variety of phenomena that are of interest to physicists, chemists, and engineers has been quantitatively characterized by using the ideas of fractal and multifractal distributions, which correspond in a unique way to the geometrical shape and dynamical properties of the systems under study. In this thesis we present the Space of Fractals and the methods of Hausdorff-Besicovitch, box-counting and Scaling to calculate the fractal dimension of a set. In this Thesis we investigate also percolation phenomena in multifractal objects that are built in a simple way. The central object of our analysis is a multifractal object that we call Qmf . In these objects the multifractality comes directly from the geometric tiling. We identify some differences between percolation in the proposed multifractals and in a regular lattice. There are basically two sources of these differences. The first is related to the coordination number, c, which changes along the multifractal. The second comes from the way the weight of each cell in the multifractal affects the percolation cluster. We use many samples of finite size lattices and draw the histogram of percolating lattices against site occupation probability p. Depending on a parameter, ρ, characterizing the multifractal and the lattice size, L, the histogram can have two peaks. We observe that the probability of occupation at the percolation threshold, pc, for the multifractal is lower than that for the square lattice. We compute the fractal dimension of the percolating cluster and the critical exponent β. Despite the topological differences, we find that the percolation in a multifractal support is in the same universality class as standard percolation. The area and the number of neighbors of the blocks of Qmf show a non-trivial behavior. A general view of the object Qmf shows an anisotropy. The value of pc is a function of ρ which is related to its anisotropy. We investigate the relation between pc and the average number of neighbors of the blocks as well as the anisotropy of Qmf. In this Thesis we study likewise the distribution of shortest paths in percolation systems at the percolation threshold in two dimensions (2D). We study paths from one given point to multiple other points. In oil recovery terminology, the given single point can be mapped to an injection well (injector) and the multiple other points to production wells (producers). In the previously standard case of one injection well and one production well separated by Euclidean distance r, the distribution of shortest paths l, P(l|r), shows a power-law behavior with exponent gl = 2.14 in 2D. Here we analyze the situation of one injector and an array A of producers. Symmetric arrays of producers lead to one peak in the distribution P(l|A), the probability that the shortest path between the injector and any of the producers is l, while the asymmetric configurations lead to several peaks in the distribution. We analyze configurations in which the injector is outside and inside the set of producers. The peak in P(l|A) for the symmetric arrays decays faster than for the standard case. For very long paths all the studied arrays exhibit a power-law behavior with exponent g ∼= gl.
Resumo:
Currently the interest in large-scale systems with a high degree of complexity has been much discussed in the scientific community in various areas of knowledge. As an example, the Internet, protein interaction, collaboration of film actors, among others. To better understand the behavior of interconnected systems, several models in the area of complex networks have been proposed. Barabási and Albert proposed a model in which the connection between the constituents of the system could dynamically and which favors older sites, reproducing a characteristic behavior in some real systems: connectivity distribution of scale invariant. However, this model neglects two factors, among others, observed in real systems: homophily and metrics. Given the importance of these two terms in the global behavior of networks, we propose in this dissertation study a dynamic model of preferential binding to three essential factors that are responsible for competition for links: (i) connectivity (the more connected sites are privileged in the choice of links) (ii) homophily (similar connections between sites are more attractive), (iii) metric (the link is favored by the proximity of the sites). Within this proposal, we analyze the behavior of the distribution of connectivity and dynamic evolution of the network are affected by the metric by A parameter that controls the importance of distance in the preferential binding) and homophily by (characteristic intrinsic site). We realized that the increased importance as the distance in the preferred connection, the connections between sites and become local connectivity distribution is characterized by a typical range. In parallel, we adjust the curves of connectivity distribution, for different values of A, the equation P(k) = P0e