6. Conclusion

Jae Kwang Kim et Shu Yang

Précédent | Suivant

Nous avons proposé une méthode d'imputation fractionnaire hot deck qui utilise un modèle paramétrique pour f ( y | x ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamOzamaabm aabaGaamyEaiaacYhacaWH4baacaGLOaGaayzkaaaaaa@3B58@  quand x MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaaCiEaaaa@36E6@  contient des composantes continues. La méthode proposée fournit une estimation robuste pour les paramètres en ce sens que le modèle d'imputation n'est pas nécessairement égal au modèle générateur de données. Le prix que nous payons dans l'IFHD est la perte d'efficacité dans l'estimation ponctuelle. Dans notre première simulation, l'estimateur IFHD pour P( Y<1 ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamiuamaabm aabaGaamywaiaaysW7caqG8aGaaGjbVlaaigdaaiaawIcacaGLPaaa aaa@3DB5@  affiche la deuxième variance en importance, mais la plus petite erreur quadratique moyenne lorsque le modèle de travail n'est pas vrai, comparativement à d'autres estimateurs.

La perte d'efficacité tient principalement au fait que les poids fractionnaires sont plus variables que ceux obtenus selon la méthode de l'IFP parce que certains des x j MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaaCiEamaaBa aaleaacaWGQbaabeaaaaa@3801@  n'aident pas à imputer y i MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamyEamaaBa aaleaacaWGPbaabeaakiaac6caaaa@38B9@ , c'est-à-dire que la valeur de f( y i | x j ; θ ^ ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamOzamaabm aabaGaamyEamaaBaaaleaacaWGPbaabeaakiaacYhacaWH4bWaaSba aSqaaiaadQgaaeqaaOGaai4oaiqaeI7agaqcaaGaayjkaiaawMcaaa aa@3FB1@  peut être très faible. Lorsque le groupe d'imputation est très petit (p. ex. m=10 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamyBaiabg2 da9iaaigdacaaIWaaaaa@3952@ ), l'imputation fractionnaire hot deck ne fait pas augmenter la variance de façon significative, comme nous pouvons le voir au tableau 5.1 sous le modèle A.

En fait, la méthode d'imputation fractionnaire peut être utilisée pour élaborer une méthode d'imputation unique en appliquant l'IFHD où m=1, MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGabiqaaiaabeqaamaabaabaaGcbaGaamyBaiabg2 da9iaaigdacaGGSaaaaa@3948@  ce qui sélectionne une valeur imputée ayant une probabilité proportionnelle au poids fractionnaire pour chaque unité manquante. En l'occurrence, l'IFHD peut être utilisée pour élaborer une méthode d'imputation unique qui reste robuste aux erreurs de spécification du modèle. Le calage de pondération est toutefois incompatible avec une imputation unique. Nous pouvons quand même respecter les contraintes de calage en employant la méthode d'imputation équilibrée examinée par Chauvet, Deville et Haziza (2011), ou l'échantillonnage réjectif de Poisson de Fuller (2009). Un examen plus approfondi suivant cette piste fera l'objet d'une prochaine étude.

Remerciements

Nous remercions deux examinateurs anonymes et le rédacteur associé de leurs commentaires très utiles. Les travaux de recherche ont été financés en partie par une subvention du Conseil de recherches en sciences naturelles et en génie (MMS-121339) et par l'entente de coopération conclue entre le Natural Resources Conservation Service de l'USDA et le Center for Survey Statistics and Methodology de l'Iowa State University.

Précédent | Suivant

Date de modification :