Imputation en présence de données contenant des zéros


Autoria(s): Nambeu, Christian O.
Contribuinte(s)

Haziza, David

Data(s)

17/03/2011

31/12/1969

17/03/2011

03/02/2011

01/12/2010

Resumo

L’imputation simple est très souvent utilisée dans les enquêtes pour compenser pour la non-réponse partielle. Dans certaines situations, la variable nécessitant l’imputation prend des valeurs nulles un très grand nombre de fois. Ceci est très fréquent dans les enquêtes entreprises qui collectent les variables économiques. Dans ce mémoire, nous étudions les propriétés de deux méthodes d’imputation souvent utilisées en pratique et nous montrons qu’elles produisent des estimateurs imputés biaisés en général. Motivé par un modèle de mélange, nous proposons trois méthodes d’imputation et étudions leurs propriétés en termes de biais. Pour ces méthodes d’imputation, nous considérons un estimateur jackknife de la variance convergent vers la vraie variance, sous l’hypothèse que la fraction de sondage est négligeable. Finalement, nous effectuons une étude par simulation pour étudier la performance des estimateurs ponctuels et de variance en termes de biais et d’erreur quadratique moyenne.

Single imputation is often used in surveys to compensate for item nonresponse. In some cases, the variable requiring imputation contains a large amount of zeroes. This is especially frequent in business surveys that collect economic variables. In this thesis, we study the properties of two imputation procedures frequently used in practice and show that they lead to biased estimators, in general. Motivated by a mixture regression model, we then propose three imputation procedures and study their properties in terms of bias. For the proposed imputation procedures, we consider a jackknife variance estimator that is consistent for the true variance, provided the overall sampling fraction is negligible. Finally, we perform a simulation study to evaluate the performance of point and variance estimators in terms of relative bias and mean square error.

Identificador

http://hdl.handle.net/1866/4724

Idioma(s)

fr

Palavras-Chave #Imputation par la régression #Imputation aléatoire #Imputation déterministe #Imputation aléatoire équilibrée #Non-réponse partielle #Jackknife #Estimation de la Variance #Regression imputation #Random imputation #Deterministic imputation #Balanced random imputation #Item nonresponse #Jackknife #Variance estimation #Plysicla Sciences - Statistics / Sciences physiques - Statistiques (UMI : 0463)
Tipo

Thèse ou Mémoire numérique / Electronic Thesis or Dissertation