5 resultados para GENERALIZED LINEAR MODEL
em Repositório Científico da Universidade de Évora - Portugal
Resumo:
Transferring distribution models between different geographical areas may be problematic, as the performance of models outside their original scope is hard to predict. A modelling procedure is needed that gets the gist of the environmental descriptors of a distribution area, without either overfitting to the training data or overestimating the species’ distribution potential.We tested the transferability power of the favourability function, a generalized linear model, on the distribution of the Iberian desman (Galemys pyrenaicus) in the Iberian territories of Portugal and Spain.We also tested the effects of two of the main potential constraints on model transferability: the analysed ranges of the predictor variables, and the completeness of the species distribution data. We modelled 10 km×10km presence/absence data from Portugal and Spain separately, extrapolated each model to the other country, and compared predictions with observations. The Spanish model, despite arguably containing more false absences, showed good predictive ability in Portugal. The Portuguese model, whose predictors ranged between only a subset of the values observed in Spain, overestimated desman distribution when transferred.We discuss possible reasons for this differential model behaviour, and highlight the importance of this kind of models for prediction and conservation applications
Resumo:
Species distribution and ecological niche models are increasingly used in biodiversity management and conservation. However, one thing that is important but rarely done is to follow up on the predictive performance of these models over time, to check if their predictions are fulfilled and maintain accuracy, or if they apply only to the set in which they were produced. In 2003, a distribution model of the Eurasian otter (Lutra lutra) in Spain was published, based on the results of a country-wide otter survey published in 1998. This model was built with logistic regression of otter presence-absence in UTM 10 km2 cells on a diverse set of environmental, human and spatial variables, selected according to statistical criteria. Here we evaluate this model against the results of the most recent otter survey, carried out a decade later and after a significant expansion of the otter distribution area in this country. Despite the time elapsed and the evident changes in this species’ distribution, the model maintained a good predictive capacity, considering both discrimination and calibration measures. Otter distribution did not expand randomly or simply towards vicinity areas,m but specifically towards the areas predicted as most favourable by the model based on data from 10 years before. This corroborates the utility of predictive distribution models, at least in the medium term and when they are made with robust methods and relevant predictor variables.
Resumo:
Estudos epidemiológicos são estudos estatísticos onde se procura relacionar ocorrências de eventos de saúde com uma ou várias causas específicas. A importância que os modelos epidemiológicos assumem hoje no estudo de doenças de foro oncológico, em particular no estabelecimento das suas etiologias, é incontornável. Segundo Ogden, J. (1999) o cancro é "um crescimento incontrolável de células anormais que produzem tumores chamados neoplasias". Estes tumores podem ter origem benigna (não se espalham pelo corpo) ou maligna (apresentam metastização de outros órgãos). Sendo uma doença actual, com uma elevada taxa de incidência em Portugal quando comparada com outras doenças (Instituto Nacional de Estatística- INE, 2009), aumentando esta taxa com a idade tal como refere Marques, L. (2003), podendo ocorrer o diagnóstico desta doença em qualquer idade. De acordo com INE (2000) pode dizer-se que o cancro está entre as três principais causas de morte em Portugal, registando-se um aumento progressivo do seu peso proporcional, sendo o cancro da mama o tipo de cancro mais comum entre as mulheres e uma das doenças com maior impacto na nossa sociedade. O objectivo principal deste trabalho é a estimação e modelação do risco de contrair uma doença de natureza não contagiosa e rara (neste caso, cancro da mama), usando dados da região do Alentejo. Pretende-se fazer um apanhado das metodologias mais empregues nesta área e aplicá-las na prática, com ênfase nos estudos caso-controlo e nos modelos lineares generalizados (GLM) - mais concretamente regressão logística. Os estudos caso-controlo são usados para identificar os factores que podem contribuir para uma condição médica, comparando indivíduos que têm essa condição (casos) com pacientes que não têm a condição, mas que de resto são semelhantes (controlos). Neste trabalho utilizou-se essa metodologia para estudar a associação entre o viver em ambiente rural/urbano e o cancro da mama. Tendo em conta que o objectivo principal deste estudo se prende com o estudo da relação entre variáveis, mais propriamente, análise de influência que uma ou mais variáveis (explicativas) têm sobre uma variável de interesse (resposta), para esse efeito são estudados os modelos lineares generalizados - GLM - unificados na mesma moldura teórica pela primeira vez por Nelder & Wedderburn (1972) - e, posteriormente aplicados ao conjunto de dados sobre cancro da mama na Região do Alentejo. O presente trabalho pretende assim, ser um contributo na identificação de factores de risco do cancro da mama na região do Alentejo. ABSTRACT: Epidemiological studies are statistical studies where attempts to relate occurrences of health events with one or more specific causes. The importance of epidemiological models that are far in the study of diseases of cancer forum, particularly in establishing their etiology, is inescapable. According to Ogden, J. (1999) cancer is "an incontrollable growth of abnormal cells that produce tumors called cancer". These tumors may be benign (not spread throughout the body) or malignant (show metastasis to other organs). Being a current illness with a high incidence rate in Portugal compared with the same respect to other diseases (National Statistics 1nstitute -1NE, 2009) having an increasing rate with age as mentioned Marques, L. (2003), and can possibly be diagnosed at any age. According to 1NE (2000) the cancer is among the top three causes of death in Portugal and there is a progressive increase of its proportional weight. Breast cancer is the most common form of cancer among women and the diseases with major impact in our society. The main objective of this work is to model and estimate the risk of contracting a non-contagious and rare disease (in this case, breast cancer), using data from the Alentejo region. It is intended to summarize some of the methodologies employed in this area and apply them in practice, with emphasis on case-control studies and generalized linear models (GLM) - more specifically the logistic regression. The case-control studies are used to identify factors that may contribute to a medical condition, comparing individuals who have this condition (cases) with patients who have not the condition but that are otherwise similar (controls). ln this work we used this methodology to study the association between living in a rural/urban and breast cancer. Given that the main objective of this study rather relates to the study of the relationship between variables to analyze the influence that one or more variables (explanatory) have on a variable (response), for this purpose we study the generalized linear models - GLM - first unified in the same theoretical framework by Nelder and Wedderburn (1972) and subsequently applied to the data set on breast cancer in the Alentejo region. This work intends to be a contribution in identifying risk factors for breast cancer in the Alentejo region.
Resumo:
Uma avaliação das metodologias de análise e recolha de dados aplicadas pelo Programa NOCTUAPortugal é de extrema importância para se apurar se estas são as mais indicadas em estudos de citizen science. Comparou-se os resultados de diferentes metodologias analíticas de estimação das tendências populacionais das espécies de aves noturnas durante o período de realização do Programa NOCTUA-Portugal (análise gráfica simples, modelos lineares generalizados (GLM-Poisson e GLMM), modelos aditivos generalizados (GAM-LOESS e GAM-mgcv) e software TRIM). Analisou-se a metodologia de censo de modo a avaliar o número de registos face à duração dos pontos de escuta, comparar a eficiência do ponto de deteção com outros estudos, variação das respostas ao longo da noite e efeito da época do ano, vento, nebulosidade e luminosidade da lua. Os resultados mostraram que a metodologia analítica mais indicada era o GLMM e que não era necessário realizar nenhum ajuste em particular na metodologia de censo; Trends in nocturnal birds in Portugal Methods and analysis of a volunteer-based monitoring program ABSTRACT: An evaluation of the methodologies of analysis and data collection applied by NOCTUA-Portugal Program is extremely important to determine whether these are the most suitable in citizen science studies. We compared the results of different analytical methodologies to estimate population trends of the species of nocturnal birds during the period of the NOCTUA-Portugal Program (simple graphical analysis, generalized linear models (GLM-Poisson and GLMM), generalized additive models (GAM-LOESS and GAMmgcv) and software TRIM). We analyzed the field methodology to assess the effect of point duration on the number of records, compared the point count efficiency with other sources, the variation of responses throughout the night, the effect of time of year, wind, cloud cover and moon luminosity. The results showed that the most suitable analytical methodology was the GLMM and it was not necessary to make any particular adjustment in the field methodology.
Resumo:
O coelho-bravo, devido à sua importância ecológica e económica, tem sido alvo de diversos planos de gestão e vários esforços têm sido empreendidos no sentido de contrariar o decréscimo das suas populações. Este estudo foi realizado em três zonas de caça do Sítio Monchique e o principal objectivo é determinar se as medidas de gestão implementadas influenciam a distribuição e abundância da espécie na área de estudo. A abundância relativa foi interpolada com o método "Inverso do Peso da Distância" {IDW), e as relações entre presença de coelho e os descritores ambientais foram analisadas através de Modelos Lineares Generalizados (GLM). Os resultados da modelação estatística mostraram que as medidas de melhoria de habitat parecem ter sido determinantes para um aumento da área de distribuição do coelho-bravo nos locais intervencionados. São propostas novas medidas de gestão, cujo objectivo será promover a continuação do aumento da ocorrência e abundância da espécie neste local. /ABSTRACT: The wild rabbit, due to its ecological and economical role, has been the target of several management plans and considerable efforts have been made to enhance its populations. This study was held in three game estates located inside Monchique Natura 2000. Site and aims to determine if the habitat management actions implemented in the study area influence rabbit distribution and abundance. The relative abundance was interpolated to all study area with lnverse Distance Weight method {IDW} and the relationships between rabbit presence and the environmental descriptors were evaluated with Generalized Linear Models (GLM). The results of the statistical modelling showed that the management actions seem to have contributed significantly to an enhancement on the rabbit occurrence in the studied game estates. Several new management actions are proposed with the aim to continue to increase rabbit occurrence and abundance in this site.