6 resultados para Cluster Analysis. Information Theory. Entropy. Cross Information Potential. Complex Data
em Instituto Politécnico do Porto, Portugal
Resumo:
Beyond the classical statistical approaches (determination of basic statistics, regression analysis, ANOVA, etc.) a new set of applications of different statistical techniques has increasingly gained relevance in the analysis, processing and interpretation of data concerning the characteristics of forest soils. This is possible to be seen in some of the recent publications in the context of Multivariate Statistics. These new methods require additional care that is not always included or refered in some approaches. In the particular case of geostatistical data applications it is necessary, besides to geo-reference all the data acquisition, to collect the samples in regular grids and in sufficient quantity so that the variograms can reflect the spatial distribution of soil properties in a representative manner. In the case of the great majority of Multivariate Statistics techniques (Principal Component Analysis, Correspondence Analysis, Cluster Analysis, etc.) despite the fact they do not require in most cases the assumption of normal distribution, they however need a proper and rigorous strategy for its utilization. In this work, some reflections about these methodologies and, in particular, about the main constraints that often occur during the information collecting process and about the various linking possibilities of these different techniques will be presented. At the end, illustrations of some particular cases of the applications of these statistical methods will also be presented.
Resumo:
A procura de padrões nos dados de modo a formar grupos é conhecida como aglomeração de dados ou clustering, sendo uma das tarefas mais realizadas em mineração de dados e reconhecimento de padrões. Nesta dissertação é abordado o conceito de entropia e são usados algoritmos com critérios entrópicos para fazer clustering em dados biomédicos. O uso da entropia para efetuar clustering é relativamente recente e surge numa tentativa da utilização da capacidade que a entropia possui de extrair da distribuição dos dados informação de ordem superior, para usá-la como o critério na formação de grupos (clusters) ou então para complementar/melhorar algoritmos existentes, numa busca de obtenção de melhores resultados. Alguns trabalhos envolvendo o uso de algoritmos baseados em critérios entrópicos demonstraram resultados positivos na análise de dados reais. Neste trabalho, exploraram-se alguns algoritmos baseados em critérios entrópicos e a sua aplicabilidade a dados biomédicos, numa tentativa de avaliar a adequação destes algoritmos a este tipo de dados. Os resultados dos algoritmos testados são comparados com os obtidos por outros algoritmos mais “convencionais" como o k-médias, os algoritmos de spectral clustering e um algoritmo baseado em densidade.
Resumo:
The present work aims to achieve and further develop a hydrogeomechanical approach in Caldas da Cavaca hydromineral system rock mass (Aguiar da Beira, NW Portugal), and contribute to a better understanding of the hydrogeological conceptual site model. A collection of several data, namely geology, hydrogeology, rock and soil geotechnics, borehole hydraulics and hydrogeomechanics, was retrieved from three rock slopes (Lagoa, Amores and Cancela). To accomplish a comprehensive analysis and rock engineering conceptualisation of the site, a multi‐technical approach were used, such as, field and laboratory techniques, hydrogeotechnical mapping, hydrogeomechanical zoning and hydrogeomechanical scheme classifications and indexes. In addition, a hydrogeomechanical data analysis and assessment, such as Hydro‐Potential (HP)‐Value technique, JW Joint Water Reduction index, Hydraulic Classification (HC) System were applied on rock slopes. The hydrogeomechanical zone HGMZ 1 of Lagoa slope achieved higher hydraulic conductivities with poorer rock mass quality results, followed by the hydrogeomechanical zone HGMZ 2 of Lagoa slope, with poor to fair rock mass quality and lower hydraulic parameters. In addition, Amores slope had a fair to good rock mass quality and the lowest hydraulic conductivity. The hydrogeomechanical zone HGMZ 3 of Lagoa slope, and the hydrogeomechanical zones HGMZ 1 and HGMZ 2 of Cancela slope had a fair to poor rock mass quality but were completely dry. Geographical Information Systems (GIS) mapping technologies was used in overall hydrogeological and hydrogeomechanical data integration in order to improve the hydrogeological conceptual site model.
Resumo:
The flow rates of drying and nebulizing gas, heat block and desolvation line temperatures and interface voltage are potential electrospray ionization parameters as they may enhance sensitivity of the mass spectrometer. The conditions that give higher sensitivity of 13 pharmaceuticals were explored. First, Plackett-Burman design was implemented to screen significant factors, and it was concluded that interface voltage and nebulizing gas flow were the only factors that influence the intensity signal for all pharmaceuticals. This fractionated factorial design was projected to set a full 2(2) factorial design with center points. The lack-of-fit test proved to be significant. Then, a central composite face-centered design was conducted. Finally, a stepwise multiple linear regression and subsequently an optimization problem solving were carried out. Two main drug clusters were found concerning the signal intensities of all runs of the augmented factorial design. p-Aminophenol, salicylic acid, and nimesulide constitute one cluster as a result of showing much higher sensitivity than the remaining drugs. The other cluster is more homogeneous with some sub-clusters comprising one pharmaceutical and its respective metabolite. It was observed that instrumental signal increased when both significant factors increased with maximum signal occurring when both codified factors are set at level +1. It was also found that, for most of the pharmaceuticals, interface voltage influences the intensity of the instrument more than the nebulizing gas flowrate. The only exceptions refer to nimesulide where the relative importance of the factors is reversed and still salicylic acid where both factors equally influence the instrumental signal. Graphical Abstract ᅟ.
Resumo:
This study aims to optimize the water quality monitoring of a polluted watercourse (Leça River, Portugal) through the principal component analysis (PCA) and cluster analysis (CA). These statistical methodologies were applied to physicochemical, bacteriological and ecotoxicological data (with the marine bacterium Vibrio fischeri and the green alga Chlorella vulgaris) obtained with the analysis of water samples monthly collected at seven monitoring sites and during five campaigns (February, May, June, August, and September 2006). The results of some variables were assigned to water quality classes according to national guidelines. Chemical and bacteriological quality data led to classify Leça River water quality as “bad” or “very bad”. PCA and CA identified monitoring sites with similar pollution pattern, giving to site 1 (located in the upstream stretch of the river) a distinct feature from all other sampling sites downstream. Ecotoxicity results corroborated this classification thus revealing differences in space and time. The present study includes not only physical, chemical and bacteriological but also ecotoxicological parameters, which broadens new perspectives in river water characterization. Moreover, the application of PCA and CA is very useful to optimize water quality monitoring networks, defining the minimum number of sites and their location. Thus, these tools can support appropriate management decisions.
Resumo:
Os crescentes custos ligados ao consumo elétrico, não apenas de cariz financeiro mas também ambiental, despertam cada vez mais para a importância da definição de estratégias de melhor utilização de recursos e eficiência energética. Esta importância tem sido reforçada pela definição de decretos-lei que vêm colocar metas e limites relativamente às despesas energéticas. Estes diplomas são também acompanhados por programas de incentivo para um setor ligado à eficiência energética. Em Portugal as medidas ligadas ao setor tem vindo a ser redirecionadas para o consumo final de energia, com a definição de metas para as instalações de maior consumo. As instalações hospitalares são grandes centros de consumo energético devido não só ao elevado número de utentes que recebem mas também pelos diversos tipos de equipamentos elétricos usados para a prestação dos serviços médicos. Como consequência disso, os investimentos e os custos operacionais são elevados, o que reforça a necessidade de gerir os gastos e consumos energéticos com a procura constante de melhoria na recolha de informação sobre todo o sistema e na adequação de intervenções com vista a uma maior eficiência energética. O Hospital Pedro Hispano vem desde algum tempo a investir no sentido de conhecer mais e melhor toda a instalação bem como os consumos energéticos a ela associados. Algumas medidas foram tomadas nesse sentido nomeadamente a instalação de analisadores de energia, de modo a obter um retrato mais fiel e fidedigno dos principais vetores de consumo. Neste momento a gestão técnica do hospital tem em análise uma grande parte da instalação recolhendo dados do consumo elétrico real do hospital. Nesta dissertação procurou-se fazer uma análise e enquadramento dos programas e metas ligados ao setor energético com ênfase nos diplomas que visão e abrangem as instalações hospitalares. Dos vários programas de incentivo à adoção de políticas de maior eficiência energética é dado especial destaque ao programa ECO.AP que visa a celebração de contratos para implementação de medidas de poupança energética ao setor público. Em colaboração com o HPH, iniciaram-se os trabalhos pelo estudo e identificação das principais fases e ferramentas utilizadas na gestão energética do edifício tendo como objetivo a reavaliação dos vetores energéticos já identificados no HPH e a criação e contabilização de novos grupos de consumo. Através de várias medições do consumo elétrico, num total superior a 650 horas de funcionamento, foi possível a criação do mapa de desagregação de consumos para o ano de 2013. A desagregação realizada conta com 3 novos vetores energéticos e com a reavaliação do peso relativo de mais 5 grupos de consumo. Das medições efetuadas destaca-se a reavaliação do consumo da central de bombagem onde a parcela considerada até à data estava 3 vezes acima do valor real medido. Com base na desagregação feita foram apontadas e estudadas medidas de implementação com o objetivo de reduzir os consumos energético em todo o hospital, destacando-se a solução apresentada para a central de bombagem. Esta medida traria um grande impacto em toda a fatura energética, não só pela sua viabilidade, mas também porque atuaria num grande centro de consumo onde até ao momento nenhuma ação do género foi implementada.