915 resultados para Secondary Data Analysis
Resumo:
The statistical analysis of compositional data should be treated using logratios of parts, which are difficult to use correctly in standard statistical packages. For this reason a freeware package, named CoDaPack was created. This software implements most of the basic statistical methods suitable for compositional data. In this paper we describe the new version of the package that now is called CoDaPack3D. It is developed in Visual Basic for applications (associated with Excel©), Visual Basic and Open GL, and it is oriented towards users with a minimum knowledge of computers with the aim at being simple and easy to use. This new version includes new graphical output in 2D and 3D. These outputs could be zoomed and, in 3D, rotated. Also a customization menu is included and outputs could be saved in jpeg format. Also this new version includes an interactive help and all dialog windows have been improved in order to facilitate its use. To use CoDaPack one has to access Excel© and introduce the data in a standard spreadsheet. These should be organized as a matrix where Excel© rows correspond to the observations and columns to the parts. The user executes macros that return numerical or graphical results. There are two kinds of numerical results: new variables and descriptive statistics, and both appear on the same sheet. Graphical output appears in independent windows. In the present version there are 8 menus, with a total of 38 submenus which, after some dialogue, directly call the corresponding macro. The dialogues ask the user to input variables and further parameters needed, as well as where to put these results. The web site http://ima.udg.es/CoDaPack contains this freeware package and only Microsoft Excel© under Microsoft Windows© is required to run the software. Kew words: Compositional data Analysis, Software
Resumo:
In a seminal paper, Aitchison and Lauder (1985) introduced classical kernel density estimation techniques in the context of compositional data analysis. Indeed, they gave two options for the choice of the kernel to be used in the kernel estimator. One of these kernels is based on the use the alr transformation on the simplex SD jointly with the normal distribution on RD-1. However, these authors themselves recognized that this method has some deficiencies. A method for overcoming these dificulties based on recent developments for compositional data analysis and multivariate kernel estimation theory, combining the ilr transformation with the use of the normal density with a full bandwidth matrix, was recently proposed in Martín-Fernández, Chacón and Mateu- Figueras (2006). Here we present an extensive simulation study that compares both methods in practice, thus exploring the finite-sample behaviour of both estimators
Resumo:
The aim of this talk is to convince the reader that there are a lot of interesting statistical problems in presentday life science data analysis which seem ultimately connected with compositional statistics. Key words: SAGE, cDNA microarrays, (1D-)NMR, virus quasispecies
Resumo:
Pounamu (NZ jade), or nephrite, is a protected mineral in its natural form following the transfer of ownership back to Ngai Tahu under the Ngai Tahu (Pounamu Vesting) Act 1997. Any theft of nephrite is prosecutable under the Crimes Act 1961. Scientific evidence is essential in cases where origin is disputed. A robust method for discrimination of this material through the use of elemental analysis and compositional data analysis is required. Initial studies have characterised the variability within a given nephrite source. This has included investigation of both in situ outcrops and alluvial material. Methods for the discrimination of two geographically close nephrite sources are being developed. Key Words: forensic, jade, nephrite, laser ablation, inductively coupled plasma mass spectrometry, multivariate analysis, elemental analysis, compositional data analysis
Resumo:
Planners in public and private institutions would like coherent forecasts of the components of age-specic mortality, such as causes of death. This has been di cult to achieve because the relative values of the forecast components often fail to behave in a way that is coherent with historical experience. In addition, when the group forecasts are combined the result is often incompatible with an all-groups forecast. It has been shown that cause-specic mortality forecasts are pessimistic when compared with all-cause forecasts (Wilmoth, 1995). This paper abandons the conventional approach of using log mortality rates and forecasts the density of deaths in the life table. Since these values obey a unit sum constraint for both conventional single-decrement life tables (only one absorbing state) and multiple-decrement tables (more than one absorbing state), they are intrinsically relative rather than absolute values across decrements as well as ages. Using the methods of Compositional Data Analysis pioneered by Aitchison (1986), death densities are transformed into the real space so that the full range of multivariate statistics can be applied, then back-transformed to positive values so that the unit sum constraint is honoured. The structure of the best-known, single-decrement mortality-rate forecasting model, devised by Lee and Carter (1992), is expressed in compositional form and the results from the two models are compared. The compositional model is extended to a multiple-decrement form and used to forecast mortality by cause of death for Japan
Resumo:
The quantitative estimation of Sea Surface Temperatures from fossils assemblages is a fundamental issue in palaeoclimatic and paleooceanographic investigations. The Modern Analogue Technique, a widely adopted method based on direct comparison of fossil assemblages with modern coretop samples, was revised with the aim of conforming it to compositional data analysis. The new CODAMAT method was developed by adopting the Aitchison metric as distance measure. Modern coretop datasets are characterised by a large amount of zeros. The zero replacement was carried out by adopting a Bayesian approach to the zero replacement, based on a posterior estimation of the parameter of the multinomial distribution. The number of modern analogues from which reconstructing the SST was determined by means of a multiple approach by considering the Proxies correlation matrix, Standardized Residual Sum of Squares and Mean Squared Distance. This new CODAMAT method was applied to the planktonic foraminiferal assemblages of a core recovered in the Tyrrhenian Sea. Kew words: Modern analogues, Aitchison distance, Proxies correlation matrix, Standardized Residual Sum of Squares
Resumo:
Functional Data Analysis (FDA) deals with samples where a whole function is observed for each individual. A particular case of FDA is when the observed functions are density functions, that are also an example of infinite dimensional compositional data. In this work we compare several methods for dimensionality reduction for this particular type of data: functional principal components analysis (PCA) with or without a previous data transformation and multidimensional scaling (MDS) for diferent inter-densities distances, one of them taking into account the compositional nature of density functions. The difeerent methods are applied to both artificial and real data (households income distributions)
Resumo:
In this paper we examine the problem of compositional data from a different starting point. Chemical compositional data, as used in provenance studies on archaeological materials, will be approached from the measurement theory. The results will show, in a very intuitive way that chemical data can only be treated by using the approach developed for compositional data. It will be shown that compositional data analysis is a particular case in projective geometry, when the projective coordinates are in the positive orthant, and they have the properties of logarithmic interval metrics. Moreover, it will be shown that this approach can be extended to a very large number of applications, including shape analysis. This will be exemplified with a case study in architecture of Early Christian churches dated back to the 5th-7th centuries AD
Resumo:
notes for class discussion and exercise
Resumo:
Slides and Handouts for class introducing some of the concepts associated with the analysis of qualitative data
Resumo:
Antecedentes: Las patologías osteomusculares del miembro superior son una importante causa de morbilidad laboral a nivel mundial y en nuestro país, particularmente en el sector de la floricultura. Del desarrollo de estos desórdenes se derivan importantes costos derivados del ausentismo laboral, incapacidades y secuelas. Objetivo: determinar la prevalencia de patología osteomuscular de miembro superior con calificación de origen de enfermedad laboral, en los trabajadores con diagnóstico de patología musculo esquelética de miembro superior y su relación con algunos factores ocupacionales y demográficos. Metodología: Estudio de corte transversal en el que se revisaron datos secundarios procedentes de una base de datos del servicio de salud ocupacional entre enero y mayo de 2015, correspondiente a 465 operarios (no administrativos) a término indefinido de una empresa floricultora de Bogotá, incluyendo únicamente aquellos trabajadores con patologías osteomusculares de miembro superior, que contaban con la clasificación en el diagnóstico ya sea como enfermedad laboral o enfermedad común y mayores de edad. Se excluyeron 19 trabajadores, quienes habían sido reubicados en nuevos sitios de trabajo y no se contó con la información para determinar su actividad antes de realizar el cambio. Se evaluaron las siguientes variables: sexo, edad, antigüedad y el cargo desempeñados por los operarios. La relación entre variables se realizó con la prueba de chi2 de Pearson. Se midió la magnitud de la asociación por medio de OR con sus respectivos intervalos de confianza del 95%. Resultados: Se incluyó a 373 operarios a término fijo, con una media de edad de 39 años (DE=5.55) y una media de antigüedad en el cargo de 6 años (DE=1.15). El 82.84% correspondió al sexo femenino. La prevalencia de enfermedad laboral osteomuscular de miembro superior fue del 54,4%. En el análisis de relación entre la calificación de la enfermedad, y demás variables (sexo, antigüedad en el cargo, edad, actividad desempeñada, localización de la lesión); se encontró que: estar entre los 40 a 49 años (OR= 1,7; IC-95%:1,12 – 2,79), diagnóstico de síndrome de manguito (OR= 4.45; IC-95%: 2.48 – 8.23) y el síndrome de túnel de carpo (OR= 4.22; IC-95%: 2.45 – 7.41) se asociaron a enfermedad laboral. Conclusiones: La prevalencia de enfermedad laboral de patología osteomuscular de miembro superior en los operarios de un cultivo de flores de la Sabana de Bogotá es del (54,4%). Se encontró una mayor asociación con el síndrome del manguito rotador y enfermedad laboral. No se encontró asociación entre la enfermedad laboral y la actividad desempeñada, el tiempo de exposición, ni con el sexo del trabajador.
Resumo:
RESUMEN El ausentismo laboral genera un gran impacto económico en las empresas y a la sociedad en general. Es un problema difícil de manejar ya que es multifactorial, porque a pesar de que en su gran mayoría es generado por enfermedad general, al analizarlo se puede encontrar otros factores que conlleven a la ausencia del trabajador y con ello producir alteración al normal funcionamiento de la empresa, por lo que resulta indispensable estudiar este tema. Objetivo Caracterizar las principales causas de ausentismo laboral en los médicos generales de una IPS que presta servicios de consulta externa de medicina general a nivel nacional durante el año 2014. Materiales y Métodos: es un estudio de corte transversal sobre datos secundarios correspondientes al registro de incapacidades que presento la IPS durante el año 2014. Los criterios de inclusión fueron los médicos generales con los que contaba la IPS que presta servicios de salud a nivel nacional durante el año 2014 y los criterios de exclusión fueron las licencias de maternidad y paternidad. El tamaño de la muestra final fue de 202 médicos y el número de incapacidades que se presentó durante el año 2014 fue 313. Se realizó análisis de distribución de frecuencias, porcentaje y prevalencia de las incapacidades. Resultados: durante el año 2014 se presentaron 313 incapacidades, en una población de 202 médicos generales con prevalencia en las mujeres. El diagnóstico más frecuente de las incapacidades fue la categoría diagnostica “otros” en el cual se encuentra migraña, vértigo, alteraciones de la mama con 59 incapacidades, seguida por enfermedades gastrointestinales con 25 incapacidades. Conclusiones y recomendaciones: Las incapacidades fueron más frecuentes en mujeres que en hombres. El diagnóstico de las incapacidades más frecuente fue “enfermedad genérica o ausencia de diagnóstico”. La incapacidad más frecuente de un día que se presentaron 46 registros. El médico que mayor número de incapacidades presento fue de 18 para el año 2014. Se recomienda a la empresa tener un seguimiento de las incapacidades repetitivas, ya que estas podrían tener relación con enfermedad laboral que aún no ha sido calificada. Se recomienda complementar la base de datos con información como el antecedente de enfermedad crónica y el sedentarismo, lo que puede permitir realizar nuevos estudios respecto al riesgo cardiovascular de esta población.
Resumo:
Resumen: Introducción: El ausentismo laboral por causa médica es un problema por la afectación que genera en el trabajador y en la empresa. Objetivo: Caracterizar el ausentismo laboral por causas médicas de una empresa de alimentos de Bogotá. Materiales y métodos: Estudio de corte transversal con datos secundarios de registros de incapacidades de los años 2013 y 2014. El procesamiento de la información se realizó con el programa SPSS, se obtuvieron medidas de tendencia central y de dispersión. Se determinó el número y la duración de incapacidades, la duración media de estas, el sistema afectado, se realizó el análisis de frecuencia por centro de costo y género. Resultados: Se registraron un total de 575 incapacidades, 387 fueron por enfermedad de origen común y 188 por accidentes de trabajo. Se perdieron 3.326 días por ausentismo, de los cuales en 45,09% se presentó en 2013 y el 54,91% restante en 2014, de estos 1985 se generaron en eventos de origen común y 1341 por accidentes de trabajo. La principal causa de incapacidades por enfermedades de origen común fueron patologías asociadas al sistema músculo esquelético, y para las originadas en accidentes de trabajo fueron las lesiones en manos. Conclusiones: para el año 2014 los accidentes de trabajo disminuyeron con respecto al año 2013 y el sistema más afectado respecto a enfermedad común fue el osteomuscular. Es conveniente que se implemente un sistema o programa de vigilancia y análisis en puestos de trabajo para identificar los factores de riesgo asociados y minimizar los riesgos.
Resumo:
Eye tracking has become a preponderant technique in the evaluation of user interaction and behaviour with study objects in defined contexts. Common eye tracking related data representation techniques offer valuable input regarding user interaction and eye gaze behaviour, namely through fixations and saccades measurement. However, these and other techniques may be insufficient for the representation of acquired data in specific studies, namely because of the complexity of the study object being analysed. This paper intends to contribute with a summary of data representation and information visualization techniques used in data analysis within different contexts (advertising, websites, television news and video games). Additionally, several methodological approaches are presented in this paper, which resulted from several studies developed and under development at CETAC.MEDIA - Communication Sciences and Technologies Research Centre. In the studies described, traditional data representation techniques were insufficient. As a result, new approaches were necessary and therefore, new forms of representing data, based on common techniques were developed with the objective of improving communication and information strategies. In each of these studies, a brief summary of the contribution to their respective area will be presented, as well as the data representation techniques used and some of the acquired results.
Resumo:
Virtual globe technology holds many exciting possibilities for environmental science. These easy-to-use, intuitive systems provide means for simultaneously visualizing four-dimensional environmental data from many different sources, enabling the generation of new hypotheses and driving greater understanding of the Earth system. Through the use of simple markup languages, scientists can publish and consume data in interoperable formats without the need for technical assistance. In this paper we give, with examples from our own work, a number of scientific uses for virtual globes, demonstrating their particular advantages. We explain how we have used Web Services to connect virtual globes with diverse data sources and enable more sophisticated usage such as data analysis and collaborative visualization. We also discuss the current limitations of the technology, with particular regard to the visualization of subsurface data and vertical sections.