937 resultados para Agrupamento de dados. Fuzzy C-Means. Inicialização dos centros de grupos. Índices de validação


Relevância:

100.00% 100.00%

Publicador:

Resumo:

This thesis presents a topological approach to studying fuzzy setsby means of modifier operators. Modifier operators are mathematical models, e.g., for hedges, and we present briefly different approaches to studying modifier operators. We are interested in compositional modifier operators, modifiers for short, and these modifiers depend on binary relations. We show that if a modifier depends on a reflexive and transitive binary relation on U, then there exists a unique topology on U such that this modifier is the closure operator in that topology. Also, if U is finite then there exists a lattice isomorphism between the class of all reflexive and transitive relations and the class of all topologies on U. We define topological similarity relation "≈" between L-fuzzy sets in an universe U, and show that the class LU/ ≈ is isomorphic with the class of all topologies on U, if U is finite and L is suitable. We consider finite bitopological spaces as approximation spaces, and we show that lower and upper approximations can be computed by means of α-level sets also in the case of equivalence relations. This means that approximations in the sense of Rough Set Theory can be computed by means of α-level sets. Finally, we present and application to data analysis: we study an approach to detecting dependencies of attributes in data base-like systems, called information systems.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Objetivou-se, neste trabalho, propor uma sistemática para o estudo e interpretação da estabilidade dos métodos de análise de agrupamento, através de vários algoritmos de agrupamento em dados de vegetação. Utilizaram-se dados provenientes de levantamento na Mata da Silvicultura, da Universidade Federal de Viçosa ,em Viçosa, MG. Para a análise de agrupamento, foram estimadas as matrizes de distância de Mahalanobis com base nos dados originais e via reamostragem "bootstrap", bem como aplicados os métodos da ligação simples, ligação completa e médias das distâncias, do centróide, da mediana e do Ward. Para a detecção de associação entre os métodos, foi aplicado o teste Qui-Quadrado (chi2) a 1 e 5% de probabilidade. Para os diversos métodos de agrupamento foi obtida a correlação cofenética. Os resultados de associação dos métodos foram semelhantes, indicando, em princípio, que qualquer algoritmo de agrupamento estudado está estabilizado e existem, de fato, grupos entre os indivíduos observados. No entanto, verificou-se que os métodos são coincidentes, exceto os métodos do centróide e Ward e os métodos do centróide e mediana, em comparação com o de Ward, respectivamente, com base nas matrizes de Mahalanobis a partir dos dados originais e "bootstrap". A sistemática proposta é promissora para o estudo e interpretação da estabilidade dos métodos de análise de agrupamento em dados de vegetação.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Dentre as plantas daninhas aquáticas imersas de maior importância nos reservatórios de usinas hidrelétricas e em represas de pequeno porte no Brasil, destacam-se as espécies Egeria densa e Egeria najas, cuja identificação pode ser difícil na fase vegetativa. O objetivo deste trabalho foi diferenciar cinco acessos de E. densa e três de E. najas, coletados nos reservatórios de Jupiá, Salto Grande, Três Irmãos, Promissão, Nova Avanhandava e Ibitinga, do complexo da Companhia Energética de São Paulo (CESP) do Estado de São Paulo, quanto às características anatômicas descritivas e quantitativas do limbo foliar, procurando-se obter melhor entendimento sobre as relações dessas estruturas anatômicas com a penetração e translocação de herbicidas, além de auxiliar na identificação de acessos suscetíveis e resistentes a determinado produto químico. Amostras do terço médio do limbo foram fixadas em FAA 50, cortadas transversalmente em micrótomo rotatório com 8 mm de espessura e coradas com azul-de-toluidina. Foi analisada a estrutura foliar e foram quantificados os caracteres anatômicos da nervura central (% epiderme das faces adaxial e abaxial, % feixe vascular e % parênquima) e da região situada entre a nervura e o bordo do limbo (% epiderme das faces adaxial e abaxial e espessura da folha). Os dados das variáveis quantitativas foram submetidos aos testes estatísticos multivariados de Análise de Agrupamento e Análise de Componentes Principais. Houve formação de três grupos principais: o primeiro foi constituído pelos três acessos de E. najas; o segundo, por quatro acessos de E. densa; e o terceiro, por apenas um acesso de E. densa. O caráter que mais contribuiu para a diferenciação entre os acessos foi a % feixe vascular da nervura central, seguido da % epiderme da face abaxial da nervura central e % epiderme das faces adaxial e abaxial da região entre a nervura e o bordo foliar. Concluiu-se que a utilização de caracteres anatômicos quantitativos permitiu auxiliar na diferenciação dos acessos e das espécies estudadas; entretanto, devem ser incrementados os estudos relacionando a estrutura anatômica com a resistência e suscetibilidade aos herbicidas.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Millon describes the normal personality by means of adaptation styles that are effective in normal environments and personality disorders such as unadapted operating styles. To operacionalize his theoretical model, Millon has built several instruments, including the Millon Clinical Multiaxial Inventory III (MCMI-III), wich consists of a self report inventory composed by 175 true or false response items, containing four verification scales, and others scales wich evaluates 14 personality patterns and 10 clinical syndromes. The Substance Dependence scale (T) is placed along with Clinical Syndromes scales. This research is justified by the lack of a Brazilian instrument to assess personality psychopathological aspects, and aims to translate and semantically adapt the MCMI-III to the Brazilian context, checking validity elements of the Substance Dependence scale, and developing a computer application for assisting the evaluation of assessment results. To this intent, 2.588 individuals data was collected, male and female, aged between 18 and 85 years, characterized as belonging to a clinical or non-clinical group, who took part in the survey via the internet or in person. Respondents completed the MCMI-III, a socio-demographic questionnaire and a subgroup also answered to the Goldberg General Health Questionnaire (GHQ). Besides descriptive statistics, we performed the analysis using the Student t test, principal components analysis and internal consistency. Despite difficulties related to translating very specific English terms, the assessment by judges, experts on Millon´s theory, and the back translation, attested the adequacy of the Brazilian version. Factorial analysis indicated the grouping of translated T scale items into three factors (social activities prejudice, lack of impulse control, and oppositional behavior), by presenting a single item on a fourth factor (apparently related to seeking pleasurable stimuli). The Cronbach alpha for this set of items was 0,82, indicating an acceptable scale reliability. The data analysis resulted in distinction of scores between clinical and non-clinical groups and between men and women; the relationship between high scores on the scale T and the other scales; scores of drug users according to the declared used substance; and the relationship between high scores on T and the verification of disorder or risk on GHQ mental health factor, indicating the instrument´s adequate sensistivity in identifying psychopathologies and the relationship between the different disorders or psychopathological personality patterns. Although further studies are necessary to develop the scores transformation factors, the computerized correction tool was adequate.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

The main goal of this work is to investigate the suitability of applying cluster ensemble techniques (ensembles or committees) to gene expression data. More specifically, we will develop experiments with three diferent cluster ensembles methods, which have been used in many works in literature: coassociation matrix, relabeling and voting, and ensembles based on graph partitioning. The inputs for these methods will be the partitions generated by three clustering algorithms, representing diferent paradigms: kmeans, ExpectationMaximization (EM), and hierarchical method with average linkage. These algorithms have been widely applied to gene expression data. In general, the results obtained with our experiments indicate that the cluster ensemble methods present a better performance when compared to the individual techniques. This happens mainly for the heterogeneous ensembles, that is, ensembles built with base partitions generated with diferent clustering algorithms

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Objective to establish a methodology for the oil spill monitoring on the sea surface, located at the Submerged Exploration Area of the Polo Region of Guamaré, in the State of Rio Grande do Norte, using orbital images of Synthetic Aperture Radar (SAR integrated with meteoceanographycs products. This methodology was applied in the following stages: (1) the creation of a base map of the Exploration Area; (2) the processing of NOAA/AVHRR and ERS-2 images for generation of meteoceanographycs products; (3) the processing of RADARSAT-1 images for monitoring of oil spills; (4) the integration of RADARSAT-1 images with NOAA/AVHRR and ERS-2 image products; and (5) the structuring of a data base. The Integration of RADARSAT-1 image of the Potiguar Basin of day 21.05.99 with the base map of the Exploration Area of the Polo Region of Guamaré for the identification of the probable sources of the oil spots, was used successfully in the detention of the probable spot of oil detected next to the exit to the submarine emissary in the Exploration Area of the Polo Region of Guamaré. To support the integration of RADARSAT-1 images with NOAA/AVHRR and ERS-2 image products, a methodology was developed for the classification of oil spills identified by RADARSAT-1 images. For this, the following algorithms of classification not supervised were tested: K-means, Fuzzy k-means and Isodata. These algorithms are part of the PCI Geomatics software, which was used for the filtering of RADARSAT-1 images. For validation of the results, the oil spills submitted to the unsupervised classification were compared to the results of the Semivariogram Textural Classifier (STC). The mentioned classifier was developed especially for oil spill classification purposes and requires PCI software for the whole processing of RADARSAT-1 images. After all, the results of the classifications were analyzed through Visual Analysis; Calculation of Proportionality of Largeness and Analysis Statistics. Amongst the three algorithms of classifications tested, it was noted that there were no significant alterations in relation to the spills classified with the STC, in all of the analyses taken into consideration. Therefore, considering all the procedures, it has been shown that the described methodology can be successfully applied using the unsupervised classifiers tested, resulting in a decrease of time in the identification and classification processing of oil spills, if compared with the utilization of the STC classifier

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Dentre as plantas daninhas aquáticas imersas de maior importância nos reservatórios de usinas hidrelétricas e em represas de pequeno porte no Brasil, destacam-se as espécies Egeria densa e Egeria najas, cuja identificação pode ser difícil na fase vegetativa. O objetivo deste trabalho foi diferenciar cinco acessos de E. densa e três de E. najas, coletados nos reservatórios de Jupiá, Salto Grande, Três Irmãos, Promissão, Nova Avanhandava e Ibitinga, do complexo da Companhia Energética de São Paulo (CESP) do Estado de São Paulo, quanto às características anatômicas descritivas e quantitativas do limbo foliar, procurando-se obter melhor entendimento sobre as relações dessas estruturas anatômicas com a penetração e translocação de herbicidas, além de auxiliar na identificação de acessos suscetíveis e resistentes a determinado produto químico. Amostras do terço médio do limbo foram fixadas em FAA 50, cortadas transversalmente em micrótomo rotatório com 8 mm de espessura e coradas com azul-de-toluidina. Foi analisada a estrutura foliar e foram quantificados os caracteres anatômicos da nervura central (% epiderme das faces adaxial e abaxial, % feixe vascular e % parênquima) e da região situada entre a nervura e o bordo do limbo (% epiderme das faces adaxial e abaxial e espessura da folha). Os dados das variáveis quantitativas foram submetidos aos testes estatísticos multivariados de Análise de Agrupamento e Análise de Componentes Principais. Houve formação de três grupos principais: o primeiro foi constituído pelos três acessos de E. najas; o segundo, por quatro acessos de E. densa; e o terceiro, por apenas um acesso de E. densa. O caráter que mais contribuiu para a diferenciação entre os acessos foi a % feixe vascular da nervura central, seguido da % epiderme da face abaxial da nervura central e % epiderme das faces adaxial e abaxial da região entre a nervura e o bordo foliar. Concluiu-se que a utilização de caracteres anatômicos quantitativos permitiu auxiliar na diferenciação dos acessos e das espécies estudadas; entretanto, devem ser incrementados os estudos relacionando a estrutura anatômica com a resistência e suscetibilidade aos herbicidas.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Pós-graduação em Ciência da Computação - IBILCE

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES)

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Pós-graduação em Ciência da Computação - IBILCE

Relevância:

100.00% 100.00%

Publicador:

Resumo:

The objective of this work was to typify, through physicochemical parameters, honey from Campos do Jordão’s microrregion, and verify how samples are grouped in accordance with the climatic production seasonality (summer and winter). It were assessed 30 samples of honey from beekeepers located in the cities of Monteiro Lobato, Campos do Jordão, Santo Antonio do Pinhal e São Bento do Sapucaí-SP, regarding both periods of honey production (November to February; July to September, during 2007 and 2008; n = 30). Samples were submitted to physicochemical analysis of total acidity, pH, humidity, water activity, density, aminoacids, ashes, color and electrical conductivity, identifying physicochemical standards of honey samples from both periods of production. Next, we carried out a cluster analysis of data using k-means algorithm, which grouped the samples into two classes (summer and winter). Thus, there was a supervised training of an Artificial Neural Network (ANN) using backpropagation algorithm. According to the analysis, the knowledge gained through the ANN classified the samples with 80% accuracy. It was observed that the ANNs have proved an effective tool to group samples of honey of the region of Campos do Jordao according to their physicochemical characteristics, depending on the different production periods.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Modelos para simulação do fluxo de água no solo e previsão de produtividade de culturas requerem informações sobre parâmetros das curvas de retenção e condutividade hidráulica do solo. Funções de pedotransferência (PTFs) se constituem numa alternativa para obtenção dessas informações, a partir de dados de textura e estrutura disponíveis em levantamentos de solos. Neste trabalho, foram ajustadas PTFs para os parâmetros do modelo de van Genuchten (vG), utilizando dados de 838 curvas de retenção de diferentes locais do Nordeste. As PTFs apresentaram boa qualidade de ajuste para os parâmetros θr e θs em contraste com a baixa capacidade preditiva para logα e n. Tais resultados sugerem a viabilidade do seu uso em modelos de simulação do balanço hídrico simplificado e para algumas aplicações práticas de irrigação. No entanto, para uso em modelos complexos de fluxo de água é importante avaliar a sensibilidade das variáveis prognósticas (produtividade agrícola, concentração de solutos) a variações nos parâmetros de vG. A alta variabilidade observada tanto nas propriedades morfológicas como nos parâmetros de vG para a região de estudo sugere o agrupamento dos dados em classes texturais ou tipos de solos.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Clustering data streams is an important task in data mining research. Recently, some algorithms have been proposed to cluster data streams as a whole, but just few of them deal with multivariate data streams. Even so, these algorithms merely aggregate the attributes without touching upon the correlation among them. In order to overcome this issue, we propose a new framework to cluster multivariate data streams based on their evolving behavior over time, exploring the correlations among their attributes by computing the fractal dimension. Experimental results with climate data streams show that the clusters' quality and compactness can be improved compared to the competing method, leading to the thoughtfulness that attributes correlations cannot be put aside. In fact, the clusters' compactness are 7 to 25 times better using our method. Our framework also proves to be an useful tool to assist meteorologists in understanding the climate behavior along a period of time.