79 resultados para Robust epipolar-geometry estimation
Resumo:
Cette thèse comporte trois articles dont un est publié et deux en préparation. Le sujet central de la thèse porte sur le traitement des valeurs aberrantes représentatives dans deux aspects importants des enquêtes que sont : l’estimation des petits domaines et l’imputation en présence de non-réponse partielle. En ce qui concerne les petits domaines, les estimateurs robustes dans le cadre des modèles au niveau des unités ont été étudiés. Sinha & Rao (2009) proposent une version robuste du meilleur prédicteur linéaire sans biais empirique pour la moyenne des petits domaines. Leur estimateur robuste est de type «plugin», et à la lumière des travaux de Chambers (1986), cet estimateur peut être biaisé dans certaines situations. Chambers et al. (2014) proposent un estimateur corrigé du biais. En outre, un estimateur de l’erreur quadratique moyenne a été associé à ces estimateurs ponctuels. Sinha & Rao (2009) proposent une procédure bootstrap paramétrique pour estimer l’erreur quadratique moyenne. Des méthodes analytiques sont proposées dans Chambers et al. (2014). Cependant, leur validité théorique n’a pas été établie et leurs performances empiriques ne sont pas pleinement satisfaisantes. Ici, nous examinons deux nouvelles approches pour obtenir une version robuste du meilleur prédicteur linéaire sans biais empirique : la première est fondée sur les travaux de Chambers (1986), et la deuxième est basée sur le concept de biais conditionnel comme mesure de l’influence d’une unité de la population. Ces deux classes d’estimateurs robustes des petits domaines incluent également un terme de correction pour le biais. Cependant, ils utilisent tous les deux l’information disponible dans tous les domaines contrairement à celui de Chambers et al. (2014) qui utilise uniquement l’information disponible dans le domaine d’intérêt. Dans certaines situations, un biais non négligeable est possible pour l’estimateur de Sinha & Rao (2009), alors que les estimateurs proposés exhibent un faible biais pour un choix approprié de la fonction d’influence et de la constante de robustesse. Les simulations Monte Carlo sont effectuées, et les comparaisons sont faites entre les estimateurs proposés et ceux de Sinha & Rao (2009) et de Chambers et al. (2014). Les résultats montrent que les estimateurs de Sinha & Rao (2009) et de Chambers et al. (2014) peuvent avoir un biais important, alors que les estimateurs proposés ont une meilleure performance en termes de biais et d’erreur quadratique moyenne. En outre, nous proposons une nouvelle procédure bootstrap pour l’estimation de l’erreur quadratique moyenne des estimateurs robustes des petits domaines. Contrairement aux procédures existantes, nous montrons formellement la validité asymptotique de la méthode bootstrap proposée. Par ailleurs, la méthode proposée est semi-paramétrique, c’est-à-dire, elle n’est pas assujettie à une hypothèse sur les distributions des erreurs ou des effets aléatoires. Ainsi, elle est particulièrement attrayante et plus largement applicable. Nous examinons les performances de notre procédure bootstrap avec les simulations Monte Carlo. Les résultats montrent que notre procédure performe bien et surtout performe mieux que tous les compétiteurs étudiés. Une application de la méthode proposée est illustrée en analysant les données réelles contenant des valeurs aberrantes de Battese, Harter & Fuller (1988). S’agissant de l’imputation en présence de non-réponse partielle, certaines formes d’imputation simple ont été étudiées. L’imputation par la régression déterministe entre les classes, qui inclut l’imputation par le ratio et l’imputation par la moyenne sont souvent utilisées dans les enquêtes. Ces méthodes d’imputation peuvent conduire à des estimateurs imputés biaisés si le modèle d’imputation ou le modèle de non-réponse n’est pas correctement spécifié. Des estimateurs doublement robustes ont été développés dans les années récentes. Ces estimateurs sont sans biais si l’un au moins des modèles d’imputation ou de non-réponse est bien spécifié. Cependant, en présence des valeurs aberrantes, les estimateurs imputés doublement robustes peuvent être très instables. En utilisant le concept de biais conditionnel, nous proposons une version robuste aux valeurs aberrantes de l’estimateur doublement robuste. Les résultats des études par simulations montrent que l’estimateur proposé performe bien pour un choix approprié de la constante de robustesse.
Inference for nonparametric high-frequency estimators with an application to time variation in betas
Resumo:
We consider the problem of conducting inference on nonparametric high-frequency estimators without knowing their asymptotic variances. We prove that a multivariate subsampling method achieves this goal under general conditions that were not previously available in the literature. We suggest a procedure for a data-driven choice of the bandwidth parameters. Our simulation study indicates that the subsampling method is much more robust than the plug-in method based on the asymptotic expression for the variance. Importantly, the subsampling method reliably estimates the variability of the Two Scale estimator even when its parameters are chosen to minimize the finite sample Mean Squared Error; in contrast, the plugin estimator substantially underestimates the sampling uncertainty. By construction, the subsampling method delivers estimates of the variance-covariance matrices that are always positive semi-definite. We use the subsampling method to study the dynamics of financial betas of six stocks on the NYSE. We document significant variation in betas within year 2006, and find that tick data captures more variation in betas than the data sampled at moderate frequencies such as every five or twenty minutes. To capture this variation we estimate a simple dynamic model for betas. The variance estimation is also important for the correction of the errors-in-variables bias in such models. We find that the bias corrections are substantial, and that betas are more persistent than the naive estimators would lead one to believe.
Resumo:
Réalisé en cotutelle avec Aix Marseille Université.
Resumo:
Afin d’effectuer des études fonctionnelles sur le génome de la souris, notre laboratoire a généré une bibliothèque de clones de cellules souches embryonnaires (ESC) présentant des suppressions chromosomiques chevauchantes aléatoires – la bibliothèque DELES. Cette bibliothèque contient des délétions couvrant environ 25% du génome murin. Dans le laboratoire, nous comptons identifier de nouveaux déterminants du destin des cellules hématopoïétiques en utilisant cet outil. Un crible primaire utilisant la benzidine pour démontrer la présence d'hémoglobine dans des corps embryoïdes (EBS) a permis d’identifier plusieurs clones délétés présentant un phénotype hématopoïétique anormal. Comme cet essai ne vérifie que la présence d'hémoglobine, le but de mon projet est d'établir un essai in vitro de différenciation des ESC permettant de mesurer le potentiel hématopoïétique de clones DELES. Mon hypothèse est que l’essai de différenciation hématopoïétique publié par le Dr Keller peut être importé dans notre laboratoire et utilisé pour étudier l'engagement hématopoïétique des clones DELES. À l’aide d’essais de RT-QPCR et de FACS, j’ai pu contrôler la cinétique de différenciation hématopoïétique en suivant l’expression des gènes hématopoïétiques et des marqueurs de surface comme CD41, c-kit, RUNX1, GATA2, CD45, β-globine 1 et TER-119. Cet essai sera utilisé pour valider le potentiel hématopoïétique des clones DELES candidats identifiés dans le crible principal. Mon projet secondaire vise à utiliser la même stratégie rétro-virale a base de Cre-loxP utilisée pour générer la bibliothèque DELES pour générer une bibliothèque de cellules KBM-7 contenant des suppressions chromosomiques chevauchantes. Mon but ici est de tester si la lignée cellulaire leuémique humaine presque haploïde KBM-7 peut être exploitée en utilisant l'approche DELES pour créer cette bibliothèque. La bibliothèque de clones KBM-7 servira à définir les activités moléculaires de drogues anti-leucémiques potentielless que nous avons identifiées dans le laboratoire parce qu’elles inhibent la croissance cellulaire dans plusieurs échantillons de leucémie myéloïde aiguë dérivés de patients. Elle me permettra également d'identifier les voies de signalisation moléculaires qui, lorsque génétiquement perturbées, peuvent conférer une résistance à ces drogues.