2 resultados para 745
em Universitat de Girona, Spain
Resumo:
Our essay aims at studying suitable statistical methods for the clustering of compositional data in situations where observations are constituted by trajectories of compositional data, that is, by sequences of composition measurements along a domain. Observed trajectories are known as “functional data” and several methods have been proposed for their analysis. In particular, methods for clustering functional data, known as Functional Cluster Analysis (FCA), have been applied by practitioners and scientists in many fields. To our knowledge, FCA techniques have not been extended to cope with the problem of clustering compositional data trajectories. In order to extend FCA techniques to the analysis of compositional data, FCA clustering techniques have to be adapted by using a suitable compositional algebra. The present work centres on the following question: given a sample of compositional data trajectories, how can we formulate a segmentation procedure giving homogeneous classes? To address this problem we follow the steps described below. First of all we adapt the well-known spline smoothing techniques in order to cope with the smoothing of compositional data trajectories. In fact, an observed curve can be thought of as the sum of a smooth part plus some noise due to measurement errors. Spline smoothing techniques are used to isolate the smooth part of the trajectory: clustering algorithms are then applied to these smooth curves. The second step consists in building suitable metrics for measuring the dissimilarity between trajectories: we propose a metric that accounts for difference in both shape and level, and a metric accounting for differences in shape only. A simulation study is performed in order to evaluate the proposed methodologies, using both hierarchical and partitional clustering algorithm. The quality of the obtained results is assessed by means of several indices
Resumo:
Diversos estudios sugieren la relación entre menor nivel socioeconómico y factores ambientales con mayor riesgo de cáncer. El objetivo del trabajo es identificar desigualdades geográficas en mortalidad e incidencia por cáncer de laringe (CL) en varones y su asociación con factores de privación y ambientales en el marco del proyecto MEDEA. Métodos: Estudio ecológico cuya población de referencia fueron los hombres residentes en el municipio de Zaragoza. El periodo de estudio fue 1996-2003. Las defunciones fueron obtenidas del Registro de Mortalidad de Aragón, los casos incidentes del Registro Poblacional de Cáncer de Zaragoza y los datos socioeconómicos del Censo de 2001. Se utilizó la base de datos del Registro Europeo de Emisiones Contaminantes en la localización de posibles industrias contaminantes. Para cada sección censal (SC) se obtuvo un índice de privación mediante análisis de componentes principales. Se obtuvieron las Razones de Mortalidad e Incidencia Estandarizadas suavizadas aplicando metodología bayesiana. Resultados: Se analizaron 211 defunciones y 569 casos incidentes, con SC conocida, que correspondieron al 95% del total de casos registrados de mortalidad y el 97,8% de incidencia. Las SC que se encontraban en el cuartil superior, mayor índice de privación, tuvieron significativamente mayor riesgo, tanto de mortalidad (2,74 veces) como de incidencia (1,66 veces). Sin embargo no se encontró asociación estadísticamente significativa con los indicadores ambientales utilizados. Conclusiones: Las SC con menor nivel económico presentan mayor riesgo de mortalidad e incidencia por CL. La posible exposición a focos industriales contaminantes no explica la variabilidad geográfica observada