952 resultados para Multivariate statistical method
Resumo:
Tous mes travaux ont été réalisés à l'aide du logiciel stata 11.
Resumo:
L’intérêt principal de cette recherche porte sur la validation d’une méthode statistique en pharmaco-épidémiologie. Plus précisément, nous allons comparer les résultats d’une étude précédente réalisée avec un devis cas-témoins niché dans la cohorte utilisé pour tenir compte de l’exposition moyenne au traitement : – aux résultats obtenus dans un devis cohorte, en utilisant la variable exposition variant dans le temps, sans faire d’ajustement pour le temps passé depuis l’exposition ; – aux résultats obtenus en utilisant l’exposition cumulative pondérée par le passé récent ; – aux résultats obtenus selon la méthode bayésienne. Les covariables seront estimées par l’approche classique ainsi qu’en utilisant l’approche non paramétrique bayésienne. Pour la deuxième le moyennage bayésien des modèles sera utilisé pour modéliser l’incertitude face au choix des modèles. La technique utilisée dans l’approche bayésienne a été proposée en 1997 mais selon notre connaissance elle n’a pas été utilisée avec une variable dépendante du temps. Afin de modéliser l’effet cumulatif de l’exposition variant dans le temps, dans l’approche classique la fonction assignant les poids selon le passé récent sera estimée en utilisant des splines de régression. Afin de pouvoir comparer les résultats avec une étude précédemment réalisée, une cohorte de personnes ayant un diagnostique d’hypertension sera construite en utilisant les bases des données de la RAMQ et de Med-Echo. Le modèle de Cox incluant deux variables qui varient dans le temps sera utilisé. Les variables qui varient dans le temps considérées dans ce mémoire sont iv la variable dépendante (premier évènement cérébrovasculaire) et une des variables indépendantes, notamment l’exposition
Resumo:
Dans ce mémoire, nous proposons une méthodologie statistique permettant d’obtenir un estimateur de l’espérance de vie des clients en assurance. Les prédictions effectuées tiennent compte des caractéristiques individuelles des clients, notamment du fait qu’ils peuvent détenir différents types de produits d’assurance (automobile, résidentielle ou les deux). Trois approches sont comparées. La première approche est le modèle de Markov simple, qui suppose à la fois l’homogénéité et la stationnarité des probabilités de transition. L’autre modèle – qui a été implémenté par deux approches, soit une approche directe et une approche par simulations – tient compte de l’hétérogénéité des probabilités de transition, ce qui permet d’effectuer des prédictions qui évoluent avec les caractéristiques des individus dans le temps. Les probabilités de transition de ce modèle sont estimées par des régressions logistiques multinomiales.
Resumo:
L'outil développé dans le cadre de cette thèse est disponible à l'adresse suivante: www.astro.umontreal.ca/~malo/banyan.php
Resumo:
L’utilisation des mesures subjectives en épidémiologie s’est intensifiée récemment, notamment avec la volonté de plus en plus affirmée d’intégrer la perception qu’ont les sujets de leur santé dans l’étude des maladies et l’évaluation des interventions. La psychométrie regroupe les méthodes statistiques utilisées pour la construction des questionnaires et l’analyse des données qui en sont issues. Ce travail de thèse avait pour but d’explorer différents problèmes méthodologiques soulevés par l’utilisation des techniques psychométriques en épidémiologie. Trois études empiriques sont présentées et concernent 1/ la phase de validation de l’instrument : l’objectif était de développer, à l’aide de données simulées, un outil de calcul de la taille d’échantillon pour la validation d’échelle en psychiatrie ; 2/ les propriétés mathématiques de la mesure obtenue : l’objectif était de comparer les performances de la différence minimale cliniquement pertinente d’un questionnaire calculée sur des données de cohorte, soit dans le cadre de la théorie classique des tests (CTT), soit dans celui de la théorie de réponse à l’item (IRT) ; 3/ son utilisation dans un schéma longitudinal : l’objectif était de comparer, à l’aide de données simulées, les performances d’une méthode statistique d’analyse de l’évolution longitudinale d’un phénomène subjectif mesuré à l’aide de la CTT ou de l’IRT, en particulier lorsque certains items disponibles pour la mesure différaient à chaque temps. Enfin, l’utilisation de graphes orientés acycliques a permis de discuter, à l’aide des résultats de ces trois études, la notion de biais d’information lors de l’utilisation des mesures subjectives en épidémiologie.
Inference for nonparametric high-frequency estimators with an application to time variation in betas
Resumo:
We consider the problem of conducting inference on nonparametric high-frequency estimators without knowing their asymptotic variances. We prove that a multivariate subsampling method achieves this goal under general conditions that were not previously available in the literature. We suggest a procedure for a data-driven choice of the bandwidth parameters. Our simulation study indicates that the subsampling method is much more robust than the plug-in method based on the asymptotic expression for the variance. Importantly, the subsampling method reliably estimates the variability of the Two Scale estimator even when its parameters are chosen to minimize the finite sample Mean Squared Error; in contrast, the plugin estimator substantially underestimates the sampling uncertainty. By construction, the subsampling method delivers estimates of the variance-covariance matrices that are always positive semi-definite. We use the subsampling method to study the dynamics of financial betas of six stocks on the NYSE. We document significant variation in betas within year 2006, and find that tick data captures more variation in betas than the data sampled at moderate frequencies such as every five or twenty minutes. To capture this variation we estimate a simple dynamic model for betas. The variance estimation is also important for the correction of the errors-in-variables bias in such models. We find that the bias corrections are substantial, and that betas are more persistent than the naive estimators would lead one to believe.
Resumo:
The present study focused on the quality of rainwater at various land use locations and its variations on interaction with various domestic rainwater harvesting systems.Sampling sites were selected based upon the land use pattern of the locations and were classified as rural, urban, industrial and sub urban. Rainwater samples were collected from the south west monsoon of May 2007 to north east monsoon of October 2008, from four sampling sites namely Kothamangalam, Emakulam, Eloor and Kalamassery, in Ernakulam district of the State of Kerala, which characterized typical rural, urban, industrial and suburban locations respectively. Rain water samples at various stages of harvesting were also collected. The samples were analyzed according to standard procedures and their physico-chemical and microbiological parameters were determined. The variations of the chemical composition of the rainwater collected were studied using statistical methods. It was observed that 17.5%, 30%, 45.8% and 12.1% of rainwater samples collected at rural, urban, industrial and suburban locations respectively had pH less than 5.6, which is considered as the pH of cloud water at equilibrium with atmospheric CO,.Nearly 46% of the rainwater samples were in acidic range in the industrial location while it was only 17% in the rural location. Multivariate statistical analysls was done using Principal Component Analysis, and the sources that inf1uence the composition of rainwater at each locations were identified .which clearly indicated that the quality of rain water is site specific and represents the atmospheric characteristics of the free fall The quality of harvested rainwater showed significant variations at different stages of harvesting due to deposition of dust from the roof catchment surface, leaching of cement constituents etc. Except the micro biological quality, the harvested rainwater satisfied the Indian Standard guide lines for drinking water. Studies conducted on the leaching of cement constituents in water concluded that tanks made with ordinary portland cement and portland pozzolana cement could be safely used for storage of rain water.
Resumo:
Geochemical composition is a set of data for predicting the climatic condition existing in an ecosystem. Both the surficial and core sediment geochemistry are helpful in monitoring, assessing and evaluating the marine environment. The aim of the research work is to assess the relationship between the biogeochemical constituents in the Cochin Estuarine System (CES), their modifications after a long period of anoxia and also to identify the various processes which control the sediment composition in this region, through a multivariate statistical approach. Therefore the study of present core sediment geochemistry has a critical role in unraveling the benchmark of their characterization. Sediment cores from four prominent zones of CES were examined for various biogeochemical aspects. The results have served as rejuvenating records for the prediction of core sediment status prevailing in the CES
Resumo:
Geochemical composition is a set of data for predicting the climatic condition existing in an ecosystem. Both the surficial and core sediment geochemistry are helpful in monitoring, assessing and evaluating the marine environment. The aim of the research work is to assess the relationship between the biogeochemical constituents in the Cochin Estuarine System (CES), their modifications after a long period of anoxia and also to identify the various processes which control the sediment composition in this region, through a multivariate statistical approach. Therefore the study of present core sediment geochemistry has a critical role in unraveling the benchmark of their characterization. Sediment cores from four prominent zones of CES were examined for various biogeochemical aspects. The results have served as rejuvenating records for the prediction of core sediment status prevailing in the CES
Resumo:
”compositions” is a new R-package for the analysis of compositional and positive data. It contains four classes corresponding to the four different types of compositional and positive geometry (including the Aitchison geometry). It provides means for computation, plotting and high-level multivariate statistical analysis in all four geometries. These geometries are treated in an fully analogous way, based on the principle of working in coordinates, and the object-oriented programming paradigm of R. In this way, called functions automatically select the most appropriate type of analysis as a function of the geometry. The graphical capabilities include ternary diagrams and tetrahedrons, various compositional plots (boxplots, barplots, piecharts) and extensive graphical tools for principal components. Afterwards, ortion and proportion lines, straight lines and ellipses in all geometries can be added to plots. The package is accompanied by a hands-on-introduction, documentation for every function, demos of the graphical capabilities and plenty of usage examples. It allows direct and parallel computation in all four vector spaces and provides the beginner with a copy-and-paste style of data analysis, while letting advanced users keep the functionality and customizability they demand of R, as well as all necessary tools to add own analysis routines. A complete example is included in the appendix
Resumo:
In standard multivariate statistical analysis common hypotheses of interest concern changes in mean vectors and subvectors. In compositional data analysis it is now well established that compositional change is most readily described in terms of the simplicial operation of perturbation and that subcompositions replace the marginal concept of subvectors. To motivate the statistical developments of this paper we present two challenging compositional problems from food production processes. Against this background the relevance of perturbations and subcompositions can be clearly seen. Moreover we can identify a number of hypotheses of interest involving the specification of particular perturbations or differences between perturbations and also hypotheses of subcompositional stability. We identify the two problems as being the counterpart of the analysis of paired comparison or split plot experiments and of separate sample comparative experiments in the jargon of standard multivariate analysis. We then develop appropriate estimation and testing procedures for a complete lattice of relevant compositional hypotheses
Resumo:
Three multivariate statistical tools (principal component analysis, factor analysis, analysis discriminant) have been tested to characterize and model the sags registered in distribution substations. Those models use several features to represent the magnitude, duration and unbalanced grade of sags. They have been obtained from voltage and current waveforms. The techniques are tested and compared using 69 registers of sags. The advantages and drawbacks of each technique are listed
Resumo:
A statistical method for classification of sags their origin downstream or upstream from the recording point is proposed in this work. The goal is to obtain a statistical model using the sag waveforms useful to characterise one type of sags and to discriminate them from the other type. This model is built on the basis of multi-way principal component analysis an later used to project the available registers in a new space with lower dimension. Thus, a case base of diagnosed sags is built in the projection space. Finally classification is done by comparing new sags against the existing in the case base. Similarity is defined in the projection space using a combination of distances to recover the nearest neighbours to the new sag. Finally the method assigns the origin of the new sag according to the origin of their neighbours
Resumo:
Introducción: Las enfermedades cardiovasculares constituyen uno de los principales obstáculos para el desarrollo del siglo XXI, según la OMS en el año 2008 fueron responsables del 30% de las muertes registradas en todo el mundo. Aunque la diabetes mellitus no se encuentra dentro de la clasificación establecida por la OMS de este grupo de enfermedades, consideramos importante su mención e inclusión dentro de nuestro estudio por el alto número de pacientes con esta enfermedad que cursa con complicaciones cardiovasculares asociadas. Metodología: Estudio de casos y controles seleccionados con un muestreo aleatorio simple con 80 casos y 80 controles apareados por edad y género, entre los cuales se encuentran 91 hombres y 60 mujeres, realizando un análisis estadístico univariado y multivariado para este tipo de estudios. Resultados: Los años de consumo de cigarrillo tuvieron una asociación con la ocurrencia del evento con un OR de 0.95 (intervalo de confianza (IC) del 95%, 0.91 – 0.99) y la asistencia a controles con especialidades de competencia cardiovascular la asociación del evento reporto un OR de 6,49 con un IC del 95%, 2.38 – 17.6. Conclusiones: De acuerdo a los resultados se encuentra que los años de consumo de cigarrillo tiene una asociación con la hospitalización en paciente con ECV y la asistencia a consultas con especialidades de competencia cardiovascular una asociación positiva con la hospitalización en este grupo de pacientes, lo que nos indica que los paciente que más se hospitalizan podrían estar relacionados con una mayor complejidad de sus patologías.
Resumo:
Ante el fenómeno de la globalización, el gigante asiático se presenta como un actor fundamental para establecer relaciones económicas, por su reciente ascenso en la jerarquía de poder, su creciente industria demandante de materias primas y su densa población, cuya capacidad de consumo aumenta día a día. Lo anterior le permite a Colombia abrir nuevos mercados que generen un mejoramiento económico y un mayor reconocimiento internacional La presente investigación se desarrolló mediante una metodología cualitativa que abarca la revisión de material bibliográfico, investigaciones realizadas y consulta de documentos oficiales. También se recogen datos estadísticos, fundamentales para soportar los objetivos de este documento y se citan casos de países como Brasil, Argentina y Chile, que constituyen un referente para conocer los procesos que llevan a cabo estas naciones con el gigante asiático relacionados a las importaciones de carne Bovina. La inclusión actual del sector ganadero en los nuevos contextos nacionales e internacionales de competencia por mercados, resulta indispensable para asegurar no sólo la estabilidad sino fundamentalmente la sostenibilidad de la actividad a mediano y largo plazo. Lo anterior debe convertirse en un propósito nacional de los sectores públicos y privados para comenzar a desarrollar, conjuntamente con los gremios; acciones que permitan remover los obstáculos que hoy en día se presentan y promover la modernización de esta actividad. Es pertinente elevar la condición de la producción, comercialización y mercadeo de la ganadería bovina colombiana, además de garantizar niveles de rentabilidad que permitan consolidar la confianza y el impulso necesario para el desarrollo de las inversiones básicas, que la normatividad a nivel de logística y salubridad exige para llegar a nuevos países.