13 resultados para Cluster Analysis. Information Theory. Entropy. Cross Information Potential. Complex Data
em Instituto Politécnico do Porto, Portugal
Resumo:
In this work, cluster analysis is applied to a real dataset of biological features of several Portuguese reservoirs. All the statistical analysis is done using R statistical software. Several metrics and methods were explored, as well as the combination of Euclidean metric and the hierarchical Ward method. Although it did not present the best combination in terms of internal and stability validation, it was still a good solution and presented good results in terms of interpretation of the problem at hand.
Resumo:
Beyond the classical statistical approaches (determination of basic statistics, regression analysis, ANOVA, etc.) a new set of applications of different statistical techniques has increasingly gained relevance in the analysis, processing and interpretation of data concerning the characteristics of forest soils. This is possible to be seen in some of the recent publications in the context of Multivariate Statistics. These new methods require additional care that is not always included or refered in some approaches. In the particular case of geostatistical data applications it is necessary, besides to geo-reference all the data acquisition, to collect the samples in regular grids and in sufficient quantity so that the variograms can reflect the spatial distribution of soil properties in a representative manner. In the case of the great majority of Multivariate Statistics techniques (Principal Component Analysis, Correspondence Analysis, Cluster Analysis, etc.) despite the fact they do not require in most cases the assumption of normal distribution, they however need a proper and rigorous strategy for its utilization. In this work, some reflections about these methodologies and, in particular, about the main constraints that often occur during the information collecting process and about the various linking possibilities of these different techniques will be presented. At the end, illustrations of some particular cases of the applications of these statistical methods will also be presented.
Resumo:
The choice of an information systems is a critical factor of success in an organization's performance, since, by involving multiple decision-makers, with often conflicting objectives, several alternatives with aggressive marketing, makes it particularly complex by the scope of a consensus. The main objective of this work is to make the analysis and selection of a information system to support the school management, pedagogical and administrative components, using a multicriteria decision aid system – MMASSITI – Multicriteria Method- ology to Support the Selection of Information Systems/Information Technologies – integrates a multicriteria model that seeks to provide a systematic approach in the process of choice of Information Systems, able to produce sustained recommendations concerning the decision scope. Its application to a case study has identi- fied the relevant factors in the selection process of school educational and management information system and get a solution that allows the decision maker’ to compare the quality of the various alternatives.
Resumo:
Mestrado em Engenharia Electrotécnica – Sistemas Eléctricos de Energia
Resumo:
A procura de padrões nos dados de modo a formar grupos é conhecida como aglomeração de dados ou clustering, sendo uma das tarefas mais realizadas em mineração de dados e reconhecimento de padrões. Nesta dissertação é abordado o conceito de entropia e são usados algoritmos com critérios entrópicos para fazer clustering em dados biomédicos. O uso da entropia para efetuar clustering é relativamente recente e surge numa tentativa da utilização da capacidade que a entropia possui de extrair da distribuição dos dados informação de ordem superior, para usá-la como o critério na formação de grupos (clusters) ou então para complementar/melhorar algoritmos existentes, numa busca de obtenção de melhores resultados. Alguns trabalhos envolvendo o uso de algoritmos baseados em critérios entrópicos demonstraram resultados positivos na análise de dados reais. Neste trabalho, exploraram-se alguns algoritmos baseados em critérios entrópicos e a sua aplicabilidade a dados biomédicos, numa tentativa de avaliar a adequação destes algoritmos a este tipo de dados. Os resultados dos algoritmos testados são comparados com os obtidos por outros algoritmos mais “convencionais" como o k-médias, os algoritmos de spectral clustering e um algoritmo baseado em densidade.
Resumo:
This study addresses the deoxyribonucleic acid (DNA) and proposes a procedure based on the association of statistics, information theory, signal processing, Fourier analysis and fractional calculus for describing fundamental characteristics of the DNA. In a first phase the 24 chromosomes of the Human are evaluated. In a second phase, 10 chromosomes for different species are also processed and the results compared. The results reveal invariance in the description and close resemblances with fractional Brownian motion.
Resumo:
Complex industrial plants exhibit multiple interactions among smaller parts and with human operators. Failure in one part can propagate across subsystem boundaries causing a serious disaster. This paper analyzes the industrial accident data series in the perspective of dynamical systems. First, we process real world data and show that the statistics of the number of fatalities reveal features that are well described by power law (PL) distributions. For early years, the data reveal double PL behavior, while, for more recent time periods, a single PL fits better into the experimental data. Second, we analyze the entropy of the data series statistics over time. Third, we use the Kullback–Leibler divergence to compare the empirical data and multidimensional scaling (MDS) techniques for data analysis and visualization. Entropy-based analysis is adopted to assess complexity, having the advantage of yielding a single parameter to express relationships between the data. The classical and the generalized (fractional) entropy and Kullback–Leibler divergence are used. The generalized measures allow a clear identification of patterns embedded in the data.
Resumo:
The present work aims to achieve and further develop a hydrogeomechanical approach in Caldas da Cavaca hydromineral system rock mass (Aguiar da Beira, NW Portugal), and contribute to a better understanding of the hydrogeological conceptual site model. A collection of several data, namely geology, hydrogeology, rock and soil geotechnics, borehole hydraulics and hydrogeomechanics, was retrieved from three rock slopes (Lagoa, Amores and Cancela). To accomplish a comprehensive analysis and rock engineering conceptualisation of the site, a multi‐technical approach were used, such as, field and laboratory techniques, hydrogeotechnical mapping, hydrogeomechanical zoning and hydrogeomechanical scheme classifications and indexes. In addition, a hydrogeomechanical data analysis and assessment, such as Hydro‐Potential (HP)‐Value technique, JW Joint Water Reduction index, Hydraulic Classification (HC) System were applied on rock slopes. The hydrogeomechanical zone HGMZ 1 of Lagoa slope achieved higher hydraulic conductivities with poorer rock mass quality results, followed by the hydrogeomechanical zone HGMZ 2 of Lagoa slope, with poor to fair rock mass quality and lower hydraulic parameters. In addition, Amores slope had a fair to good rock mass quality and the lowest hydraulic conductivity. The hydrogeomechanical zone HGMZ 3 of Lagoa slope, and the hydrogeomechanical zones HGMZ 1 and HGMZ 2 of Cancela slope had a fair to poor rock mass quality but were completely dry. Geographical Information Systems (GIS) mapping technologies was used in overall hydrogeological and hydrogeomechanical data integration in order to improve the hydrogeological conceptual site model.
Resumo:
The flow rates of drying and nebulizing gas, heat block and desolvation line temperatures and interface voltage are potential electrospray ionization parameters as they may enhance sensitivity of the mass spectrometer. The conditions that give higher sensitivity of 13 pharmaceuticals were explored. First, Plackett-Burman design was implemented to screen significant factors, and it was concluded that interface voltage and nebulizing gas flow were the only factors that influence the intensity signal for all pharmaceuticals. This fractionated factorial design was projected to set a full 2(2) factorial design with center points. The lack-of-fit test proved to be significant. Then, a central composite face-centered design was conducted. Finally, a stepwise multiple linear regression and subsequently an optimization problem solving were carried out. Two main drug clusters were found concerning the signal intensities of all runs of the augmented factorial design. p-Aminophenol, salicylic acid, and nimesulide constitute one cluster as a result of showing much higher sensitivity than the remaining drugs. The other cluster is more homogeneous with some sub-clusters comprising one pharmaceutical and its respective metabolite. It was observed that instrumental signal increased when both significant factors increased with maximum signal occurring when both codified factors are set at level +1. It was also found that, for most of the pharmaceuticals, interface voltage influences the intensity of the instrument more than the nebulizing gas flowrate. The only exceptions refer to nimesulide where the relative importance of the factors is reversed and still salicylic acid where both factors equally influence the instrumental signal. Graphical Abstract ᅟ.
Resumo:
Introdução: Programas de self-management têm como objectivo habilitar os pacientes com estratégias necessárias para levar a cabo procedimentos específicos para a patologia. A última revisão sistemática sobre selfmanagament em DPOC foi realizada em 2007, concluindo-se que ainda não era possível fornecer dados claros e suficientes acerca de recomendações sobre a estrutura e conteúdo de programas de self-managament na DPOC. A presente revisão tem o intuito de complementar a análise da revisão anterior, numa tentativa de inferir a influência do ensino do self-management na DPOC. Objectivos: verificar a influência dos programas de self-management na DPOC, em diversos indicadores relacionados com o estado de saúde do paciente e na sua utilização dos serviços de saúde. Estratégia de busca: pesquisa efectuada nas bases de dados PubMed e Cochrane Collaboration (01/01/2007 – 31/08/2010). Palavras-chave: selfmanagement education, self-management program, COPD e pulmonary rehabilitation. Critérios de Selecção: estudos randomizados sobre programas de selfmanagement na DPOC. Extracção e Análise dos Dados: 2 investigadores realizaram, independentemente, a avaliação e extracção de dados de cada artigo. Resultados: foram considerados 4 estudos randomizados em selfmanagement na DPOC nos quais se verificaram benefícios destes programas em diversas variáveis: qualidade de vida a curto e médio prazo, utilização dos diferentes recursos de saúde, adesões a medicação de rotina, controle das exacerbações e diminuição da sintomatologia. Parece não ocorrer alteração na função pulmonar e no uso de medicação de emergência, sendo inconclusivo o seu efeito na capacidade de realização de exercício. Conclusões: programas de self-management aparentam ter impacto positivo na qualidade de vida, recurso a serviços de saúde, adesão à medicação, planos de acção e níveis de conhecimento da DPOC. Discrepâncias nos critérios de selecção das amostras utilizadas, períodos de seguimento desiguais, consistência das variáveis mensuradas, condicionam a informação disponibilizada sobre este assunto.
Resumo:
Este trabalho compreende uma análise crítica e reflexiva sobre o que atualmente existe no âmbito dos sistemas de navegação integrados (e.g. sistemas de posicionamento global com sistemas de navegação por inércia). O objetivo deste estudo vai também no sentido de desenvolver para um dispositivo móvel, um sistema de telemetria para automóveis baseado na plataforma Android fazendo uso de conceitos estudados e tecnologias existentes. Pretende-se demonstrar a potencialidade da integração de um sistema de posicionamento por satélite, com um sistema de navegação por inércia, em dispositivos cada vez mais acessíveis ao utilizador comum, tais como tablets, smartphones e outros equipamentos dotados de dispositivos MEMS (sistemas microelectromecânicos) de baixo custo usando a plataforma Android. Este trabalho pretende explorar a forma como podemos fundir os registos dos vários sensores, tais como o acelerómetro, magnetómetro e giroscópio, para determinar a orientação do dispositivo e assim integrar esta informação de maior frequência, com a informação disponibilizada pelo GNSS de menor frequência, tendo como objetivo final a determinação em tempo real do posicionamento do dispositivo, destacando as forças e fraquezas de cada um dos sistemas de navegação.
Resumo:
This study aims to optimize the water quality monitoring of a polluted watercourse (Leça River, Portugal) through the principal component analysis (PCA) and cluster analysis (CA). These statistical methodologies were applied to physicochemical, bacteriological and ecotoxicological data (with the marine bacterium Vibrio fischeri and the green alga Chlorella vulgaris) obtained with the analysis of water samples monthly collected at seven monitoring sites and during five campaigns (February, May, June, August, and September 2006). The results of some variables were assigned to water quality classes according to national guidelines. Chemical and bacteriological quality data led to classify Leça River water quality as “bad” or “very bad”. PCA and CA identified monitoring sites with similar pollution pattern, giving to site 1 (located in the upstream stretch of the river) a distinct feature from all other sampling sites downstream. Ecotoxicity results corroborated this classification thus revealing differences in space and time. The present study includes not only physical, chemical and bacteriological but also ecotoxicological parameters, which broadens new perspectives in river water characterization. Moreover, the application of PCA and CA is very useful to optimize water quality monitoring networks, defining the minimum number of sites and their location. Thus, these tools can support appropriate management decisions.
Resumo:
Os crescentes custos ligados ao consumo elétrico, não apenas de cariz financeiro mas também ambiental, despertam cada vez mais para a importância da definição de estratégias de melhor utilização de recursos e eficiência energética. Esta importância tem sido reforçada pela definição de decretos-lei que vêm colocar metas e limites relativamente às despesas energéticas. Estes diplomas são também acompanhados por programas de incentivo para um setor ligado à eficiência energética. Em Portugal as medidas ligadas ao setor tem vindo a ser redirecionadas para o consumo final de energia, com a definição de metas para as instalações de maior consumo. As instalações hospitalares são grandes centros de consumo energético devido não só ao elevado número de utentes que recebem mas também pelos diversos tipos de equipamentos elétricos usados para a prestação dos serviços médicos. Como consequência disso, os investimentos e os custos operacionais são elevados, o que reforça a necessidade de gerir os gastos e consumos energéticos com a procura constante de melhoria na recolha de informação sobre todo o sistema e na adequação de intervenções com vista a uma maior eficiência energética. O Hospital Pedro Hispano vem desde algum tempo a investir no sentido de conhecer mais e melhor toda a instalação bem como os consumos energéticos a ela associados. Algumas medidas foram tomadas nesse sentido nomeadamente a instalação de analisadores de energia, de modo a obter um retrato mais fiel e fidedigno dos principais vetores de consumo. Neste momento a gestão técnica do hospital tem em análise uma grande parte da instalação recolhendo dados do consumo elétrico real do hospital. Nesta dissertação procurou-se fazer uma análise e enquadramento dos programas e metas ligados ao setor energético com ênfase nos diplomas que visão e abrangem as instalações hospitalares. Dos vários programas de incentivo à adoção de políticas de maior eficiência energética é dado especial destaque ao programa ECO.AP que visa a celebração de contratos para implementação de medidas de poupança energética ao setor público. Em colaboração com o HPH, iniciaram-se os trabalhos pelo estudo e identificação das principais fases e ferramentas utilizadas na gestão energética do edifício tendo como objetivo a reavaliação dos vetores energéticos já identificados no HPH e a criação e contabilização de novos grupos de consumo. Através de várias medições do consumo elétrico, num total superior a 650 horas de funcionamento, foi possível a criação do mapa de desagregação de consumos para o ano de 2013. A desagregação realizada conta com 3 novos vetores energéticos e com a reavaliação do peso relativo de mais 5 grupos de consumo. Das medições efetuadas destaca-se a reavaliação do consumo da central de bombagem onde a parcela considerada até à data estava 3 vezes acima do valor real medido. Com base na desagregação feita foram apontadas e estudadas medidas de implementação com o objetivo de reduzir os consumos energético em todo o hospital, destacando-se a solução apresentada para a central de bombagem. Esta medida traria um grande impacto em toda a fatura energética, não só pela sua viabilidade, mas também porque atuaria num grande centro de consumo onde até ao momento nenhuma ação do género foi implementada.