1000 resultados para Método das K-Médias


Relevância:

80.00% 80.00%

Publicador:

Resumo:

OBJETIVO: Traduzir a Escala de Estresse Percebido para a língua portuguesa do Brasil e verificar sua validade para mensurar o estresse percebido de idosos brasileiros. MÉTODOS: A escala foi traduzida e testada em sua versão completa, com 14 questões e na reduzida, com dez questões. A tradução obedeceu às etapas de tradução, tradução reversa e revisão por um comitê. A escala traduzida foi aplicada, por meio de entrevista, a 76 idosos com idade média de 70,04 anos (DP=6,34; mín: 60; máx: 84). A consistência interna foi verificada por meio do coeficiente alfa de Cronbach e a validade de construto, por análise fatorial exploratória com rotação ortogonal pelo método varimax. As médias das versões completa e reduzida foram analisadas comparando o estresse percebido em função da auto-avaliação da saúde, nível econômico percebido, estado civil, condições de residência, entre outras. RESULTADOS: Quanto à confiabilidade, a versão completa apresentou consistência interna semelhante (r=0,82) à reduzida (r=0,83). A análise fatorial revelou a existência de dois fatores para a completa e um para a reduzida. A questão 12 apresentou as menores cargas fatoriais. Ao analisar a possibilidade de a escala diferenciar o estresse percebido em função das variáveis, verificou-se que a versão completa obteve maiores diferenças no estresse do que a reduzida. CONCLUSÕES: A Escala de Estresse Percebido mostrou-se clara e confiável para mensurar o estresse percebido de idosos brasileiros, apresentando qualidades psicométricas adequadas.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

A procura de padrões nos dados de modo a formar grupos é conhecida como aglomeração de dados ou clustering, sendo uma das tarefas mais realizadas em mineração de dados e reconhecimento de padrões. Nesta dissertação é abordado o conceito de entropia e são usados algoritmos com critérios entrópicos para fazer clustering em dados biomédicos. O uso da entropia para efetuar clustering é relativamente recente e surge numa tentativa da utilização da capacidade que a entropia possui de extrair da distribuição dos dados informação de ordem superior, para usá-la como o critério na formação de grupos (clusters) ou então para complementar/melhorar algoritmos existentes, numa busca de obtenção de melhores resultados. Alguns trabalhos envolvendo o uso de algoritmos baseados em critérios entrópicos demonstraram resultados positivos na análise de dados reais. Neste trabalho, exploraram-se alguns algoritmos baseados em critérios entrópicos e a sua aplicabilidade a dados biomédicos, numa tentativa de avaliar a adequação destes algoritmos a este tipo de dados. Os resultados dos algoritmos testados são comparados com os obtidos por outros algoritmos mais “convencionais" como o k-médias, os algoritmos de spectral clustering e um algoritmo baseado em densidade.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Dados de sensoriamento remoto têm sido largamente utilizados para classificação da cobertura e uso da terra, em particular graças à aquisição periódica de imagens de satélite e à generalização dos sistemas de processamento digital de imagens, que oferecem uma variedade de algoritmos de classificação de imagens. Este trabalho teve por objetivo avaliar alguns dos métodos mais comuns de classificações supervisionadas e não supervisionadas para imagens do sensor TM do satélite Landsat-5, em três áreas com diferentes padrões de paisagem em Rondônia: (1) áreas de fazendas de "Médio porte", (2) assentamentos no padrão "Espinha de peixe" e (3) áreas de contato entre floresta e "Cerrado". A comparação com um mapa de referência baseado na estatística Kappa produziu indicadores de desempenho bons ou superiores (melhores resultados - K-médias: k = 0,68; k = 0,77; k = 0,64 e MaxVer: k = 0,71; k = 0,89; k = 0,70, respectivamente nas três áreas citadas), para os algoritmos utilizados. Os resultados indicaram que a escolha de um algoritmo deve considerar tanto a capacidade de discriminar várias assinaturas espectrais em diferentes padrões de paisagem quanto a relação custo/benefício decorrente das várias etapas do trabalho dos operadores que elaboram um mapa de cobertura e uso da terra. Este trabalho apontou a necessidade de esforço mais sistemático de avaliação prévia de várias opções de execução de um projeto específico antes de se iniciar o trabalho de elaboração de um mapa de cobertura e uso da terra.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

The main objective of this study is to apply recently developed methods of physical-statistic to time series analysis, particularly in electrical induction s profiles of oil wells data, to study the petrophysical similarity of those wells in a spatial distribution. For this, we used the DFA method in order to know if we can or not use this technique to characterize spatially the fields. After obtain the DFA values for all wells, we applied clustering analysis. To do these tests we used the non-hierarchical method called K-means. Usually based on the Euclidean distance, the K-means consists in dividing the elements of a data matrix N in k groups, so that the similarities among elements belonging to different groups are the smallest possible. In order to test if a dataset generated by the K-means method or randomly generated datasets form spatial patterns, we created the parameter Ω (index of neighborhood). High values of Ω reveals more aggregated data and low values of Ω show scattered data or data without spatial correlation. Thus we concluded that data from the DFA of 54 wells are grouped and can be used to characterize spatial fields. Applying contour level technique we confirm the results obtained by the K-means, confirming that DFA is effective to perform spatial analysis

Relevância:

80.00% 80.00%

Publicador:

Resumo:

In recent years, the DFA introduced by Peng, was established as an important tool capable of detecting long-range autocorrelation in time series with non-stationary. This technique has been successfully applied to various areas such as: Econophysics, Biophysics, Medicine, Physics and Climatology. In this study, we used the DFA technique to obtain the Hurst exponent (H) of the profile of electric density profile (RHOB) of 53 wells resulting from the Field School of Namorados. In this work we want to know if we can or not use H to spatially characterize the spatial data field. Two cases arise: In the first a set of H reflects the local geology, with wells that are geographically closer showing similar H, and then one can use H in geostatistical procedures. In the second case each well has its proper H and the information of the well are uncorrelated, the profiles show only random fluctuations in H that do not show any spatial structure. Cluster analysis is a method widely used in carrying out statistical analysis. In this work we use the non-hierarchy method of k-means. In order to verify whether a set of data generated by the k-means method shows spatial patterns, we create the parameter Ω (index of neighborhood). High Ω shows more aggregated data, low Ω indicates dispersed or data without spatial correlation. With help of this index and the method of Monte Carlo. Using Ω index we verify that random cluster data shows a distribution of Ω that is lower than actual cluster Ω. Thus we conclude that the data of H obtained in 53 wells are grouped and can be used to characterize space patterns. The analysis of curves level confirmed the results of the k-means

Relevância:

80.00% 80.00%

Publicador:

Resumo:

The use of non-human primates in scientific research has contributed significantly to the biomedical area and, in the case of Callithrix jacchus, has provided important evidence on physiological mechanisms that help explain its biology, making the species a valuable experimental model in different pathologies. However, raising non-human primates in captivity for long periods of time is accompanied by behavioral disorders and chronic diseases, as well as progressive weight loss in most of the animals. The Primatology Center of the Universidade Federal do Rio Grande do Norte (UFRN) has housed a colony of C. jacchus for nearly 30 years and during this period these animals have been weighed systematically to detect possible alterations in their clinical conditions. This procedure has generated a volume of data on the weight of animals at different age ranges. These data are of great importance in the study of this variable from different perspectives. Accordingly, this paper presents three studies using weight data collected over 15 years (1985-2000) as a way of verifying the health status and development of the animals. The first study produced the first article, which describes the histopathological findings of animals with probable diagnosis of permanent wasting marmoset syndrome (WMS). All the animals were carriers of trematode parasites (Platynosomum spp) and had obstruction in the hepatobiliary system; it is suggested that this agent is one of the etiological factors of the syndrome. In the second article, the analysis focused on comparing environmental profile and cortisol levels between the animals with normal weight curve evolution and those with WMS. We observed a marked decrease in locomotion, increased use of lower cage extracts and hypocortisolemia. The latter is likely associated to an adaptation of the mechanisms that make up the hypothalamus-hypophysis-adrenal axis, as observed in other mammals under conditions of chronic malnutrition. Finally, in the third study, the animals with weight alterations were excluded from the sample and, using computational tools (K-means and SOM) in a non-supervised way, we suggest found new ontogenetic development classes for C. jacchus. These were redimensioned from five to eight classes: infant I, infant II, infant III, juvenile I, juvenile II, sub-adult, young adult and elderly adult, in order to provide a more suitable classification for more detailed studies that require better control over the animal development

Relevância:

80.00% 80.00%

Publicador:

Resumo:

The main goal of this work is to investigate the suitability of applying cluster ensemble techniques (ensembles or committees) to gene expression data. More specifically, we will develop experiments with three diferent cluster ensembles methods, which have been used in many works in literature: coassociation matrix, relabeling and voting, and ensembles based on graph partitioning. The inputs for these methods will be the partitions generated by three clustering algorithms, representing diferent paradigms: kmeans, ExpectationMaximization (EM), and hierarchical method with average linkage. These algorithms have been widely applied to gene expression data. In general, the results obtained with our experiments indicate that the cluster ensemble methods present a better performance when compared to the individual techniques. This happens mainly for the heterogeneous ensembles, that is, ensembles built with base partitions generated with diferent clustering algorithms

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Peng was the first to work with the Technical DFA (Detrended Fluctuation Analysis), a tool capable of detecting auto-long-range correlation in time series with non-stationary. In this study, the technique of DFA is used to obtain the Hurst exponent (H) profile of the electric neutron porosity of the 52 oil wells in Namorado Field, located in the Campos Basin -Brazil. The purpose is to know if the Hurst exponent can be used to characterize spatial distribution of wells. Thus, we verify that the wells that have close values of H are spatially close together. In this work we used the method of hierarchical clustering and non-hierarchical clustering method (the k-mean method). Then compare the two methods to see which of the two provides the best result. From this, was the parameter � (index neighborhood) which checks whether a data set generated by the k- average method, or at random, so in fact spatial patterns. High values of � indicate that the data are aggregated, while low values of � indicate that the data are scattered (no spatial correlation). Using the Monte Carlo method showed that combined data show a random distribution of � below the empirical value. So the empirical evidence of H obtained from 52 wells are grouped geographically. By passing the data of standard curves with the results obtained by the k-mean, confirming that it is effective to correlate well in spatial distribution

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Os dados são provenientes de 234 touros da raça Nelore participantes de um teste de progênie, no período de 1996 a 2003. A diferença esperada na progênie (DEP) de sete características: peso aos 120 e 210 dias, efeito materno (DMPP120 e DMPP210), peso e perímetro escrotal aos 365 e 450 dias, efeito direto (DDP365, DDP450, DDPE365 e DDPE450) e idade ao primeiro parto (DDIPP) foi utilizada para classificar os animais em três grupos, assim como identificar quais as características possuíram maior poder discriminatório na formação de cada grupo. Para tanto, foram utilizados procedimentos estatísticos multivariados de análise de agrupamentos k-médias e componentes principais. Os resultados evidenciaram que, dos três grupos formados, dois se destacaram quanto aos valores médios das DEPs. A importância desses dois grupos de touros foi confirmada pela análise de componentes principais, que associou a eles valores superiores de DEPs diretas de peso e perímetro escrotal. A quantidade da variabilidade original retida pelos dois primeiros componentes principais foi de 70,22%. Estes procedimentos mostraram-se eficientes e constituíram importantes ferramentas para classificar touros, discriminar variáveis, bem como resumir informações multivariadas, podendo ser usados como auxílio valioso na seleção de reprodutores para uso nos programas de melhoramento genético.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Pós-graduação em Agronomia (Genética e Melhoramento de Plantas) - FCAV

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Métodos quimiométricos (estatísticos) são empregados para classificar um conjunto de compostos derivados de neolignanas com atividade biológica contra a Paracoccidioides brasiliensis. O método AM1 (Austin Model 1) foi utilizado para calcular um conjunto de descritores moleculares (propriedades) para os compostos em estudo. A seguir, os descritores foram analisados utilizando os seguintes métodos de reconhecimento de padrões: Análise de Componentes Principais (PCA), Análise Hierárquica de Agrupamentos (HCA) e o método de K-vizinhos mais próximos (KNN). Os métodos PCA e HCA mostraram-se bastante eficientes para classificação dos compostos estudados em dois grupos (ativos e inativos). Três descritores moleculares foram responsáveis pela separação entre os compostos ativos e inativos: energia do orbital molecular mais alto ocupado (EHOMO), ordem de ligação entre os átomos C1'-R7 (L14) e ordem de ligação entre os átomos C5'-R6 (L22). Como as variáveis responsáveis pela separação entre compostos ativos e inativos são descritores eletrônicos, conclui-se que efeitos eletrônicos podem desempenhar um importante papel na interação entre receptor biológico e compostos derivados de neolignanas com atividade contra a Paracoccidioides brasiliensis.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Efficiency in the use of genetic variability, whether existing or created, increases when properly explored and analysed. Incorporation of biotechnology into breeding programs has been the general practice. The challenge for the researcher is the constant development of new and improved cultivars. The aim of this experiment was to select progenies with superior characteristics, whether or not carriers of the RR gene, derived from bi-parental crosses in the soybean, with the help of multivariate techniques. The experiment was carried out in a family-type experimental design, including controls, during the agricultural year 2010/2011 and 2011/2012 in Jaboticabal in the Brazilian State of São Paulo. From the F3 generation, phenotypically superior plants were selected, which were evaluated for the following traits: number of days to flowering; number of days to maturity; height of first pod insertion; plant height at maturity; lodging; agronomic value; number of branches; number of pods per plant; 100-seed weight; number of seeds per plant; grain yield per plant. Given the results, it appears possible to select superior progeny by principal component analysis. Cluster analysis using the K-means method links progeny according to the most important characteristics in each group and identifies, by the Ward method and by means of a dendrogram, the structure of similarity and divergence between selected progeny. Both methods are effective in aiding progeny selection.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

Neste artigo é apresentada uma abordagem para aumentar a eficácia das Redes Neurais Artificiais de Funções de Base Radial utilizando um algoritmo de agrupamento de dados via Floresta de Caminhos Ótimos. Algumas técnicas comumente empregadas para essa tarefa, como o conhecido k-médias, requerem um determinado número de classes/agrupamentos prévio à sua execução. Embora o número de classes seja conhecido em problemas supervisionados, o número real de agrupamentos é difícil de ser encontrado, dado que uma classe pode ser representada por mais de um agrupamento. Experimentos em nove bases de dados, em conjunto com análises estatísticas, demonstraram que o classificador por Floresta de Caminhos Ótimos possui um melhor desempenho que a técnica k-médias, bem como encontra as médias das distribuições Gaussianas em posições muito similares às encontradas por este último. Entretanto, o classificador por Floresta de Caminhos Ótimos possui um custo computacional maior, dado que a sua etapa de treinamento é mais custosa que a da técnica k-médias.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

The objective of this work was to typify, through physicochemical parameters, honey from Campos do Jordão’s microrregion, and verify how samples are grouped in accordance with the climatic production seasonality (summer and winter). It were assessed 30 samples of honey from beekeepers located in the cities of Monteiro Lobato, Campos do Jordão, Santo Antonio do Pinhal e São Bento do Sapucaí-SP, regarding both periods of honey production (November to February; July to September, during 2007 and 2008; n = 30). Samples were submitted to physicochemical analysis of total acidity, pH, humidity, water activity, density, aminoacids, ashes, color and electrical conductivity, identifying physicochemical standards of honey samples from both periods of production. Next, we carried out a cluster analysis of data using k-means algorithm, which grouped the samples into two classes (summer and winter). Thus, there was a supervised training of an Artificial Neural Network (ANN) using backpropagation algorithm. According to the analysis, the knowledge gained through the ANN classified the samples with 80% accuracy. It was observed that the ANNs have proved an effective tool to group samples of honey of the region of Campos do Jordao according to their physicochemical characteristics, depending on the different production periods.

Relevância:

80.00% 80.00%

Publicador:

Resumo:

The main objective of this study is to apply recently developed methods of physical-statistic to time series analysis, particularly in electrical induction s profiles of oil wells data, to study the petrophysical similarity of those wells in a spatial distribution. For this, we used the DFA method in order to know if we can or not use this technique to characterize spatially the fields. After obtain the DFA values for all wells, we applied clustering analysis. To do these tests we used the non-hierarchical method called K-means. Usually based on the Euclidean distance, the K-means consists in dividing the elements of a data matrix N in k groups, so that the similarities among elements belonging to different groups are the smallest possible. In order to test if a dataset generated by the K-means method or randomly generated datasets form spatial patterns, we created the parameter Ω (index of neighborhood). High values of Ω reveals more aggregated data and low values of Ω show scattered data or data without spatial correlation. Thus we concluded that data from the DFA of 54 wells are grouped and can be used to characterize spatial fields. Applying contour level technique we confirm the results obtained by the K-means, confirming that DFA is effective to perform spatial analysis