938 resultados para R-Statistical computing


Relevância:

100.00% 100.00%

Publicador:

Resumo:

Multivariate Methoden stellen ein wesentliches Instrumentarium zur Datenanalyse in der Ökologie dar. Sie werden in der Ökologie häufig eingesetzt und sind seit langem Gegenstand der Lehre in der Abteilung Geobotanik der Universität Freiburg. In den letzten Jahren wurde als Werkzeug das Programm R eingeführt. R ist ein frei verfügbares, kommandozeilenorientiertes Statistikprogramm, das für eine Reihe von Betriebssystemen angeboten wird (R-Development Core-Team 2007). Das Programm befindet sich in rascher Entwicklung (derzeit Version 2.10) und wird zunehmend auch von Ökologen eingesetzt. Bislang existiert kein deutschsprachiges Lehrbuch zur Anwendung multivariater Methoden mit R. Mit MultiStaR wird versucht, diese Lücke zu schließen und den Studierenden Lernmaterialien an die Hand zu geben, die Übungen mit dem eigentlichen Analysewerkzeug mit einschließen.

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Stratigraphic Columns (SC) are the most useful and common ways to represent the eld descriptions (e.g., grain size, thickness of rock packages, and fossil and lithological components) of rock sequences and well logs. In these representations the width of SC vary according to the grain size (i.e., the wider the strata, the coarser the rocks (Miall 1990; Tucker 2011)), and the thickness of each layer is represented at the vertical axis of the diagram. Typically these representations are drawn 'manually' using vector graphic editors (e.g., Adobe Illustrator®, CorelDRAW®, Inskape). Nowadays there are various software which automatically plot SCs, but there are not versatile open-source tools and it is very di cult to both store and analyse stratigraphic information. This document presents Stratigraphic Data Analysis in R (SDAR), an analytical package1 designed for both plotting and facilitate the analysis of Stratigraphic Data in R (R Core Team 2014). SDAR, uses simple stratigraphic data and takes advantage of the exible plotting tools available in R to produce detailed SCs. The main bene ts of SDAR are: (i) used to generate accurate and complete SC plot including multiple features (e.g., sedimentary structures, samples, fossil content, color, structural data, contacts between beds), (ii) developed in a free software environment for statistical computing and graphics, (iii) run on a wide variety of platforms (i.e., UNIX, Windows, and MacOS), (iv) both plotting and analysing functions can be executed directly on R's command-line interface (CLI), consequently this feature enables users to integrate SDAR's functions with several others add-on packages available for R from The Comprehensive R Archive Network (CRAN).

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Examples of compositional data. The simplex, a suitable sample space for compositional data and Aitchison's geometry. R, a free language and environment for statistical computing and graphics

Relevância:

100.00% 100.00%

Publicador:

Resumo:

R from http://www.r-project.org/ is ‘GNU S’ – a language and environment for statistical computing and graphics. The environment in which many classical and modern statistical techniques have been implemented, but many are supplied as packages. There are 8 standard packages and many more are available through the cran family of Internet sites http://cran.r-project.org . We started to develop a library of functions in R to support the analysis of mixtures and our goal is a MixeR package for compositional data analysis that provides support for operations on compositions: perturbation and power multiplication, subcomposition with or without residuals, centering of the data, computing Aitchison’s, Euclidean, Bhattacharyya distances, compositional Kullback-Leibler divergence etc. graphical presentation of compositions in ternary diagrams and tetrahedrons with additional features: barycenter, geometric mean of the data set, the percentiles lines, marking and coloring of subsets of the data set, theirs geometric means, notation of individual data in the set . . . dealing with zeros and missing values in compositional data sets with R procedures for simple and multiplicative replacement strategy, the time series analysis of compositional data. We’ll present the current status of MixeR development and illustrate its use on selected data sets

Relevância:

100.00% 100.00%

Publicador:

Resumo:

Collecting data via a questionnaire and analyzing them while preserving respondents’ privacy may increase the number of respondents and the truthfulness of their responses. It may also reduce the systematic differences between respondents and non-respondents. In this paper, we propose a privacy-preserving method for collecting and analyzing survey responses using secure multi-party computation (SMC). The method is secure under the semi-honest adversarial model. The proposed method computes a wide variety of statistics. Total and stratified statistical counts are computed using the secure protocols developed in this paper. Then, additional statistics, such as a contingency table, a chi-square test, an odds ratio, and logistic regression, are computed within the R statistical environment using the statistical counts as building blocks. The method was evaluated on a questionnaire dataset of 3,158 respondents sampled for a medical study and simulated questionnaire datasets of up to 50,000 respondents. The computation time for the statistical analyses linearly scales as the number of respondents increases. The results show that the method is efficient and scalable for practical use. It can also be used for other applications in which categorical data are collected.

Relevância:

90.00% 90.00%

Publicador:

Resumo:

The performing arts have traditionally made limited use of and showed limited acceptance of computing technology. There are cognitive, physical, environmental, and social influences on the use of computers in performing arts. This paper will examine those influences on the practice of computers in the performing arts and their implications for education in those areas. These implications for the learning environment include infrastructure, interface design, industrial design, and software functionality. Although many of the issues raised in this paper are common to all visual and performing arts, there are significant differences between them which require abstraction of the concepts presented in this paper beyond the more practical focus intended. In particular there are differences in the ways humans are involved in the presentation of a work, and the transitory verses static nature of time in art products.

Relevância:

90.00% 90.00%

Publicador:

Resumo:

The R statistical environment and language has demonstrated particular strengths for interactive development of statistical algorithms, as well as data modelling and visualisation. Its current implementation has an interpreter at its core which may result in a performance penalty in comparison to directly executing user algorithms in the native machine code of the host CPU. In contrast, the C++ language has no built-in visualisation capabilities, handling of linear algebra or even basic statistical algorithms; however, user programs are converted to high-performance machine code, ahead of execution. A new method avoids possible speed penalties in R by using the Rcpp extension package in conjunction with the Armadillo C++ matrix library. In addition to the inherent performance advantages of compiled code, Armadillo provides an easy-to-use template-based meta-programming framework, allowing the automatic pooling of several linear algebra operations into one, which in turn can lead to further speedups. With the aid of Rcpp and Armadillo, conversion of linear algebra centered algorithms from R to C++ becomes straightforward. The algorithms retains the overall structure as well as readability, all while maintaining a bidirectional link with the host R environment. Empirical timing comparisons of R and C++ implementations of a Kalman filtering algorithm indicate a speedup of several orders of magnitude.

Relevância:

90.00% 90.00%

Publicador:

Resumo:

efeitos são frequentemente observados na morbidade e mortalidade por doenças respiratórias e cardiovasculares, câncer de pulmão, diminuição da função respiratória, absenteísmo escolar e problemas relacionados com a gravidez. Estudos também sugerem que os grupos mais suscetíveis são as crianças e os idosos. Esta tese apresenta estudos sobre o efeito da poluição do ar na saúde na saúde na cidade do Rio de Janeiro e aborda aspectos metodológicos sobre a análise de dados e imputação de dados faltantes em séries temporais epidemiológicas. A análise de séries temporais foi usada para estimar o efeito da poluição do ar na mortalidade de pessoas idosas por câncer de pulmão com dados dos anos 2000 e 2001. Este estudo teve como objetivo avaliar se a poluição do ar está associada com antecipação de óbitos de pessoas que já fazem parte de uma população de risco. Outro estudo foi realizado para avaliar o efeito da poluição do ar no baixo peso ao nascer de nascimentos a termo. O desenho deste estudo foi o de corte transversal usando os dados disponíveis no ano de 2002. Em ambos os estudos foram estimados efeitos moderados da poluição do ar. Aspectos metodológicos dos estudos epidemiológicos da poluição do ar na saúde também são abordados na tese. Um método para imputação de dados faltantes é proposto e implementado numa biblioteca para o aplicativo R. A metodologia de imputação é avaliada e comparada com outros métodos frequentemente usados para imputação de séries temporais de concentrações de poluentes atmosféricos por meio de técnicas de simulação. O método proposto apresentou desempenho superior aos tradicionalmente utilizados. Também é realizada uma breve revisão da metodologia usada nos estudos de séries temporais sobre os efeitos da poluição do ar na saúde. Os tópicos abordados na revisão estão implementados numa biblioteca para a análise de dados de séries temporais epidemiológicas no aplicativo estatístico R. O uso da biblioteca é exemplificado com dados de internações hospitalares de crianças por doenças respiratórias no Rio de Janeiro. Os estudos de cunho metodológico foram desenvolvidos no âmbito do estudo multicêntrico para avaliação dos efeitos da poluição do ar na América Latina o Projeto ESCALA.

Relevância:

90.00% 90.00%

Publicador:

Resumo:

BACKGROUND: Many analyses of microarray association studies involve permutation, bootstrap resampling and cross-validation, that are ideally formulated as embarrassingly parallel computing problems. Given that these analyses are computationally intensive, scalable approaches that can take advantage of multi-core processor systems need to be developed. RESULTS: We have developed a CUDA based implementation, permGPU, that employs graphics processing units in microarray association studies. We illustrate the performance and applicability of permGPU within the context of permutation resampling for a number of test statistics. An extensive simulation study demonstrates a dramatic increase in performance when using permGPU on an NVIDIA GTX 280 card compared to an optimized C/C++ solution running on a conventional Linux server. CONCLUSIONS: permGPU is available as an open-source stand-alone application and as an extension package for the R statistical environment. It provides a dramatic increase in performance for permutation resampling analysis in the context of microarray association studies. The current version offers six test statistics for carrying out permutation resampling analyses for binary, quantitative and censored time-to-event traits.

Relevância:

90.00% 90.00%

Publicador:

Resumo:

Introducción: La enfermedad cardiovascular es la principal causa de muerte a nivel mundial, afectando principalmente la salud pública de países pobres con economías emergentes. La transición epidemiológica en Colombia ha incrementado la proporción de pacientes ancianos con enfermedad cardiovascular y que requieren cirugía cardíaca. Sin embargo, no existe consenso sobre la conducta para la selección de pacientes añosos para este tipo de intervenciones. El objetivo de este estudio fue definir el riesgo mortalidad asociado a cirugía cardíaca en este grupo de pacientes, basados en una revisión sistemática de la literatura. Materiales y Métodos: Se diseñó una revisión sistemática empleando las plataformas PubMed (Medline), EBSCO Discovery Service, Ovid SP-EBMR, Sciverse y MDConsult. Los términos de búsqueda fueron “Aged”, “Cardiac surgery” and “Mortality”, conjugados de acuerdo con el lenguaje de cada buscador. Las publicaciones fueron seleccionadas por consenso. Los resultados se analizaron en un modelo de Mantel-Haenszel. Resultados: La búsqueda arrojó un total de 8.565 publicaciones. Los datos analizados en el modelo incluyeron 81.547 pacientes (7.855 octogenarios y 73.692 más jóvenes). El riesgo de mortalidad asociado a cirugía cardíaca en octogenarios fue de 125% (OR=2,35, IC 95% [2,15 - 2,57]). Discusión: El sometimiento de pacientes octogenarios a cirugías cardíacas mayores es una decisión que requiere un juicio clínico minucioso en el que es importante destacar que la probabilidad de un resultado francamente desfavorable es alta. Se necesitan más estudios diseñados que permitan aumentar la solidez de la evidencia actual en cuanto al riesgo aquí encontrado.

Relevância:

90.00% 90.00%

Publicador:

Resumo:

Objetivos: Determinar la prevalencia y los factores asociados con el desarrollo de hipotiroidismo autoinmune (HA) en una cohorte de pacientes con lupus eritematoso sistémico (LES), y analizar la información actual en cuanto a la prevalencia e impacto de la enfermedad tiroidea autoinmune y la autoinmunidad tiroidea en pacientes con LES. Métodos: Este fue un estudio realizado en dos pasos. Primero, un total de 376 pacientes con LES fueron evaluados sistemáticamente por la presencia de: 1) HA confirmado, 2) positividad para anticuerpos tiroperoxidasa/tiroglobulina (TPOAb/TgAb) sin hipotiroidismo, 3) hipotiroidismo no autoinmune, y 4) pacientes con LES sin hipotiroidismo ni positividad para TPOAb/TgAb. Se construyeron modelos multivariados y árboles de regresión y clasificación para analizar los datos. Segundo, la información actual fue evaluada a través de una revisión sistemática de la literatura (RLS). Se siguieron las guías PRISMA para la búsqueda en las bases de datos PubMed, Scopus, SciELO y Librería Virtual en Salud. Resultados: En nuestra cohorte, la prevalencia de HA confirmado fue de 12% (Grupo 1). Sin embargo, la frecuencia de positividad para TPOAb y TgAb fue de 21% y 10%, respectivamente (Grupo 2). Los pacientes con LES sin HA, hipotiroidismo no autoinmune ni positividad para TPOAb/TgAb constituyeron el 40% de la corhorte. Los pacientes con HA confirmada fueron estadísticamente significativo de mayor edad y tuvieron un inicio tardío de la enfermedad. El tabaquismo (ORA 6.93, IC 95% 1.98-28.54, p= 0.004), la presencia de Síndrome de Sjögren (SS) (ORA 23.2, IC 95% 1.89-359.53, p= 0.015) y la positividad para anticuerpos anti-péptido cíclico citrulinado (anti-CCP) (ORA 10.35, IC 95% 1.04-121.26, p= 0.047) se asociaron con la coexistencia de LES-HA, ajustado por género y duración de la enfermedad. El tabaquismo y el SS fueron confirmados como factores predictivos para LES-HA (AUC del modelo CART = 0.72). En la RSL, la prevalencia de ETA en LES varío entre 1% al 60%. Los factores asociados con esta poliautoinmunidad fueron el género femenino, edad avanzada, tabaquismo, positividad para algunos anticuerpos, SS y el compromiso articular y cutáneo. Conclusiones: La ETA es frecuente en pacientes con LES, y no afecta la severidad del LES. Los factores de riesgo identificados ayudarán a los clínicos en la búsqueda de ETA. Nuestros resultados deben estimular políticas para la suspensión del tabaquismo en pacientes con LES.

Relevância:

90.00% 90.00%

Publicador:

Resumo:

Introducción: el lupus eritematoso sistémico (LES) es considerado una enfermedad de alto costo. La expresión clínica de la enfermedad depende de la ubicación geografía y la etnicidad. El objetivo de este estudio fue el calcular los costos ambulatorios relacionado al LES en una cohorte colombiana, identificar los predictores de costos y comparar nuestro resultados con otras poblaciones. Métodos: Se realizó una aproximación de tipo prevalencia en 100 pacientes LES en quienes se evaluaron los costos directos médicos, directos no médicos, indirectos e intangibles. Todos los costos médicos fueron evaluados usando una metodología abajo hacia arriba. Los costos directos fueron valorados desde una perspectiva social usando una metodología de micro-costeo. Los costos indirectos se evaluaron mediante una aproximación de capital humano, y los costos intangibles calculados a partir de los años de vida ajustados por calidad (AVAC). Se analizaron los datos por medio de un análisis multivariado. Para comparaciones con otras poblaciones todos los costos fueron expresados como la razón entre los costos y producto interno bruto nacional per cápita. Resultados: La media de costos totales fue 13.031±9.215 USD (ajustados por el factor de conversión de paridad del poder adquisitivo), lo cual representa el 1,66 del PIB per capita de Colombia. Los costos directos son el 64% de los costos totales. Los costos médicos representan el 80% de los costos directos,. Los costos indirectos fueron el 10% y los costos intangibles el 25% de los costos totales. Los medicamentos representaron el 45% de los costos directos. Mayores costos se relacionaron con el estrato socioeconómico, seguro médico privado, AVAC, alopecia, micofenolato mofetilo, y terapia anticoagulante. Los costos directos ajustados de los pacientes con LES en Colombia fueron mayores que en Norte América y en Europa. Conclusiones: el LES impone una carga económica importante para la sociedad. Los costos relacionados con la atención médica y AVAC fueron los principales contribuyentes al alto costo de la enfermedad. Estos resultados pueden ser referencia para determinar políticas en salud pública así como comparar el gasto en salud de forma internacional.

Relevância:

90.00% 90.00%

Publicador:

Resumo:

Introducción: El tratamiento con antagonistas del factor de necrosis tumoral alfa (anti TNF) ha impactado el pronóstico y la calidad de vida de los pacientes con artritis reumatoide (AR) positivamente, sin embargo, se interroga un incremento en el riesgo de desarrollar melanoma. Objetivo: Conocer la asociación entre el uso de anti TNF y el desarrollo de melanoma maligno en pacientes con AR. Metodología: Se realizó una búsqueda sistemática en MEDLINE, EMBASE, COCHRANE LIBRARY y LILACS para ensayos clínicos, estudios observacionales, revisiones y meta-análisis en pacientes adultos con diagnóstico de AR y manejo con anti TNF (Certolizumab pegol, Adalimumab, Etanercept, Infliximab y Golimumab). Resultados: 37 estudios clínicos cumplieron los criterios de inclusión para el meta-análisis, con una población de 16567 pacientes. El análisis de heterogeneidad no fue significativo (p=1), no se encontró diferencia en el riesgo entre los grupos comparados DR -0.00 (IC 95% -0.001; -0.001). Un análisis adicional de los estudios en los que se reportó al menos 1 caso de melanoma (4222 pacientes) tampoco mostró diferencia en el riesgo DR -0.00 (IC 95% -0.004 ; -0.003). Conclusión: En la evidencia disponible a la fecha no encontramos asociación significativa entre el tratamiento con anti TNF en pacientes con diagnóstico de AR y el desarrollo de melanoma cutáneo.

Relevância:

90.00% 90.00%

Publicador:

Resumo:

Since 1991 Colombia has had a market-determined Peso - US Dollar Nominal Exchange Rate (NER), after more than 20 years of controlled and multiple exchange rates. The behavior (revaluation / devaluation) of the NER is constantly reported in news, editorials and op-eds of major newspapers of the nation with particular attention to revaluation. The uneven reporting of revaluation episodes can be explained by the existence of an interest group particulary affected by revaluation, looking to increase awareness and sympathy for help from public institutions. Using the number of news and op-eds from a major Colombian newspaper, it is shown that there is an over-reporting of revaluation episodes in contrast to devaluation ones. Secondly, using text analysis upon the content of the news, it is also shown that the words devaluation and revaluation are far apart in the distribution of words within the news; and revaluation is highly correlated with words related to: public institutions, exporters and the need of assistance. Finally it is also shown that the probability of the central bank buying US dollars to lessen revaluation effects increases with the number of news; even though the central bank allegedly intervenes in the exchange rate market only to tame volatility or accumulate international reserves.