940 resultados para Clusters multiuso
Resumo:
Dissertation submitted in partial fulfillment of the requirements for the Degree of Master of Science in Geospatial Technologies.
Resumo:
RESUMO - Enquadramento/Objectivos: As doenças oncológicas constituem a segunda causa de morte em Portugal, e têm um profundo impacto psicossocial, não só pela sua elevada incidência e mortalidade mas também pelos enormes custos envolvidos na sua prevenção, tratamento e reabilitação. De acordo com estudos anteriores, existem disparidades geográficas na incidência da doença oncológica. É por isso indispensável caracterizar e analisar as diferentes distribuições espaciais no tempo e no espaço, para controlar a doença e promover a saúde, contribuindo ao mesmo tempo para uma melhor compreensão da etiologia da doença. Este projecto compreende 3 objectivos principais que são: a caracterização de distribuição espacio-temporal do cancro do pulmão e do cancro do estômago, separadamente e em conjunto, na região sul de Portugal Continental (abrangida pelo ROR-Sul) no espaço temporal de 2000 a 2008, procurando identificar potenciais áreas de risco no desenvolvimento destes tumores. Metodologia: Numa primeira fase realizou-se um estudo descritivo das taxas de incidência dos tumores aqui retratados por idades, por sexo, por ano e por distritos. Posteriormente com o objectivo de identificar a presença de áreas de elevada incidência, procedeu-se à análise de clustering espacio-temporal das taxas de incidência ao nível dos concelhos na região do estudo, em 2000-2008. Resultados: Os resultados da análise descritiva revelaram que ambos os tumores são mais incidentes nos homens do que nas mulheres e que estes são igualmente mais incidentes em pessoas com mais de 75 anos. A análise de clustering espacio temporal permitiu verificar a existência um padrão geográfico heterogéneo da incidência de ambos os tumores, da qual resultaram 3 clusters para o cancro do estômago e 2 clusters para o cancro do pulmão (p <0,001). Os clusters do estômago pertencem maioritariamente à região do Alentejo e os clusters do cancro do pulmão à região da grande Lisboa. Conclusões: Os resultados da análise de clustering demonstraram um padrão heterogéneo da distribuição da incidência dos dois cancros na região e período temporal do estudo. As zonas identificadas de elevado risco são diferentes para ambos o tumores. A região que apresenta maior risco para o desenvolvimento do cancro do estômago é o Alentejo e do pulmão é o distrito de Lisboa.
Resumo:
A Work Project, presented as part of the requirements for the Award of a Masters Degree in Finance from the NOVA – School of Business and Economics
Resumo:
Dissertação apresentada como requisito parcial para obtenção do grau de Mestre em Gestão de Informação
Resumo:
Tese apresentada para cumprimento dos requisitos necessários à obtenção do grau de Doutor em e-Planeamento
Resumo:
A Work Project, presented as part of the requirements for the Award of a Masters Degree in Management from the NOVA – School of Business and Economics
Resumo:
Tede de Doutoramento, na especialidade de Ciências Políticas apresentada à FDUNL
Resumo:
Previous evaluation of the genetic variability of four biogeographical populations of Lutzomyia whitmani from known foci of cutaneous leishmaniasis in Brazil demonstrated two main spatial clusters: Corte de Pedra-BA, Ilhéus-BA and Serra de Baturité-CE in the first cluster, and Martinho Campos-MG in the second. Further analysis showed a high degree of homogeneity in Corte de Pedra population but not in the others, which presented a significant percentage of specimens displaced from their phenon of origin (discrepant individuals). In the present work we analyzed the frequencies of association coefficients in the matrixes of similarity per population of Lutzomyia whitmani from both sexes and the general phenograms obtained, in a more detailed study of those discrepant specimens. Populational stability was observed for Corte de Pedra population, whereas the three remaining populations showed varying degrees of heterogeneity and different displacements according to sex. Our results strongly suggested the existence of a genetic flow between the lineages North-South/North-East and Ilhéus/Serra do Baturité of Lutzomyia whitmani.
Resumo:
Dissertação para obtenção do Grau de Mestre em Engenharia Informática
Resumo:
O arroz é um dos alimentos básicos mais importantes para a população mundial, sendo um dos cereais mais consumidos em todo o mundo. Possui um alto teor em hidratos de carbono devido à alta concentração de amido, contém ainda proteínas, vitaminas, minerais e poucas gorduras. A quantidade de proteína a ingerir é requisito para uma dieta adequada (0,75g/kg/dia), devido ao desempenho vital que esta tem na saúde humana. O arroz pelo seu papel determinante na alimentação mundial faz com que os aminoácidos, constituintes das proteínas, mereçam o foco deste estudo. Por outro lado, o arroz pelo seu tipo de cultivo é uma das maiores fontes de ingestão de arsénio para o Homem, um importante agente cancerígeno e contaminante da cadeia alimentar. Isto faz com que este elemento seja igualmente merecedor de análise no presente estudo. Neste estudo foram analisadas, ao nível dos diferentes aminoácidos e do arsénio, 39 amostras de diferentes tipos e regiões de arroz nacional que foram remetidas para uma análise multivariada. Foi feita uma caracterização e posterior comparação entre tipos/variedades/região de arroz, que demonstra para ambos os tipos de estatística (ANOVA e Kruskal-Wallis), diferenças entre variedades, arroz integral e arroz branco. Verifica-se que ao analisar pelas várias características do arroz, não existem diferenças ao nível do arsénio e que, através da correlação de Spearman, este se correlaciona positivamente com arroz integral e negativamente com arroz branco. Na análise de clusters, os aminoácidos (variáveis) foram 3 conjuntos: baixa, média e alta concentração. Por sua vez, as amostras dividem-se pela variedade, formando ainda um cluster em que existe uma fusão de variedades. Para classificação de arroz no futuro, com base no perfil de aminoácidos, foi possível a criação de um modelo k-NN cujo erro de classificação fosse nulo.
Resumo:
A Diabetes Mellitus Tipo2 é uma doença crónica que afecta sobretudo a população adulta e é responsável por mais de 90% dos casos de diabetes. A sua prevalência tem aumentado rapidamente, implicando elevados custos em saúde. Está normalmente associada a várias co-morbilidades e complicações, constituindo-se uma das principais causas de morbilidade e mortalidade no mundo. Em Portugal, dados dos Observatório Nacional da Diabetes revelam que, em 2012, cerca de 13% da população adulta sofria de diabetes (aproximadamente um milhão de pessoas), sendo a taxa de incidência anual de 500 novos casos por cada 100 000 habitantes. A amostra do estudo incluiu os doentes com DM2 com mais de 20 anos, num total de 205068 utentes registados nos centros de cuidados de saúde primários da ARSLVT e que residem na área de Lisboa e Vale do Tejo. O enfoque desta dissertação não é somente a exploração dos padrões geográficos da DM Tipo2 mas, sobretudo, a análise de sensibilidade e robustez das estatísticas espaciais utilizadas. Os objectivos são fundamentalmente metodológicos e passam pela aplicação de estatísticas espaciais, em ambiente ArcGIS®, GeoDaTM e linguagem de computação estatística R; pela reflexão em torno das medidas de dependência e de heterogeneidade geográfica e ainda pela análise quantitativa da irregularidade da distribuição espacial da DM Tipo2 na região de Lisboa, baseada em decisões decorrentes do estudo da sensibilidade e da robustez das estatísticas espaciais. A estrutura espacial dos dados foi estudada segundo matrizes de vizinhos mais próximos, fazendo variar o número de vizinhos (1 a 20). Uma vez definida a estrutura de vizinhança procurou-se traduzir o grau de similaridade espacial que existe entre áreas que são próximas, utilizando como medida o Índice Global de Moran. A identificação dos clusters espaciais foi feita através da aplicação das estatísticas de Anselin Local Moran´s I e Getis-Ord Gi*. Após aplicação das estatísticas referidas procurou-se avaliar, ao longo dos testes realizados, a percentagem de permanência das freguesias num cluster espacial. Da análise dos resultados, e tendo em conta os objectivos propostos, concluiu-se que o mapeamento de padrões espaciais é pouco sensível à variação dos parâmetros utilizados. As duas ferramentas de análise espacial utilizadas (análise de cluster e outlier - Anselin´s Local Moran´s I e análises de Hot spot - Getis-Ord Gi*), embora muito distintas, geraram resultados muito similares em termos de identificação da localização geográfica dos clusters para todas as variáveis. Desta forma, foi possível identificar alguns clusters, ainda que de um modo geral exista uma aleatoriedade espacial nos dados.
Resumo:
Saccharomyces cerevisiae as well as other microorganisms are frequently used in industry with the purpose of obtain different kind of products that can be applied in several areas (research investigation, pharmaceutical compounds, etc.). In order to obtain high yields for the desired product, it is necessary to make an adequate medium supplementation during the growth of the microorganisms. The higher yields are typically reached by using complex media, however the exact formulation of these media is not known. Moreover, it is difficult to control the exact composition of complex media, leading to batch-to-batch variations. So, to overcome this problem, some industries choose to use defined media, with a defined and known chemical composition. However these kind of media, many times, do not reach the same high yields that are obtained by using complex media. In order to obtain similar yield with defined media the addition of many different compounds has to be tested experimentally. Therefore, the industries use a set of empirical methods with which it is tried to formulate defined media that can reach the same high yields as complex media. In this thesis, a defined medium for Saccharomyces cerevisiae was developed using a rational design approach. In this approach a given metabolic network of Saccharomyces cerevisiae is divided into a several unique and not further decomposable sub networks of metabolic reactions that work coherently in steady state, so called elementary flux modes. The EFMtool algorithm was used in order to calculate the EFM’s for two Saccharomyces cerevisiae metabolic networks (amino acids supplemented metabolic network; amino acids non-supplemented metabolic network). For the supplemented metabolic network 1352172 EFM’s were calculated and then divided into: 1306854 EFM’s producing biomass, and 18582 EFM’s exclusively producing CO2 (cellular respiration). For the non-supplemented network 635 EFM’s were calculated and then divided into: 215 EFM’s producing biomass; 420 EFM’s producing exclusively CO2. The EFM’s of each group were normalized by the respective glucose consumption value. After that, the EFMs’ of the supplemented network were grouped again into: 30 clusters for the 1306854 EFMs producing biomass and, 20 clusters for the 18582 EFM’s producing CO2. For the non-supplemented metabolic network the respective EFM’s of each metabolic function were grouped into 10 clusters. After the clustering step, the concentrations of the other medium compounds were calculated by considering a reasonable glucose amount and by accounting for the proportionality between the compounds concentrations and the glucose ratios. The approach adopted/developed in this thesis may allow a faster and more economical way for media development.
Resumo:
This study analyses financial data using the result characterization of a self-organized neural network model. The goal was prototyping a tool that may help an economist or a market analyst to analyse stock market series. To reach this goal, the tool shows economic dependencies and statistics measures over stock market series. The neural network SOM (self-organizing maps) model was used to ex-tract behavioural patterns of the data analysed. Based on this model, it was de-veloped an application to analyse financial data. This application uses a portfo-lio of correlated markets or inverse-correlated markets as input. After the anal-ysis with SOM, the result is represented by micro clusters that are organized by its behaviour tendency. During the study appeared the need of a better analysis for SOM algo-rithm results. This problem was solved with a cluster solution technique, which groups the micro clusters from SOM U-Matrix analyses. The study showed that the correlation and inverse-correlation markets projects multiple clusters of data. These clusters represent multiple trend states that may be useful for technical professionals.
Resumo:
Botnets are a group of computers infected with a specific sub-set of a malware family and controlled by one individual, called botmaster. This kind of networks are used not only, but also for virtual extorsion, spam campaigns and identity theft. They implement different types of evasion techniques that make it harder for one to group and detect botnet traffic. This thesis introduces one methodology, called CONDENSER, that outputs clusters through a self-organizing map and that identify domain names generated by an unknown pseudo-random seed that is known by the botnet herder(s). Aditionally DNS Crawler is proposed, this system saves historic DNS data for fast-flux and double fastflux detection, and is used to identify live C&Cs IPs used by real botnets. A program, called CHEWER, was developed to automate the calculation of the SVM parameters and features that better perform against the available domain names associated with DGAs. CONDENSER and DNS Crawler were developed with scalability in mind so the detection of fast-flux and double fast-flux networks become faster. We used a SVM for the DGA classififer, selecting a total of 11 attributes and achieving a Precision of 77,9% and a F-Measure of 83,2%. The feature selection method identified the 3 most significant attributes of the total set of attributes. For clustering, a Self-Organizing Map was used on a total of 81 attributes. The conclusions of this thesis were accepted in Botconf through a submited article. Botconf is known conferênce for research, mitigation and discovery of botnets tailled for the industry, where is presented current work and research. This conference is known for having security and anti-virus companies, law enforcement agencies and researchers.
Resumo:
INTRODUCTION: Rabies is an acute disease of the central nervous system and is responsible for the deaths of thousands of humans, wild animals and livestock, particularly cattle, as well as causing major economic losses. This study describes the genetic characterization of rabies virus variants that circulate in Desmodus rotundus populations and are transmitted to herbivores. METHODS: Fifty rabies virus isolates from bovines and equines in the States of São Paulo and Minas Gerais, Brazil, were genetically characterized and compared with sequences retrieved from GenBank. RESULTS: Two clusters (I and II) with mean nucleotide identities of 99.1 and 97.6% were found. The first of these contained nearly all the samples analyzed. Lineages from other Brazilian states grouped in cluster II. CONCLUSIONS: Analysis of the amino acid sequences of the N proteins revealed the existence of genetic markers that may indicate possible variations between geographic regions, although the biologically active regions are conserved within the species over space and time.