Ajustements pour la non-réponse dans les plans stratifiés assortis de modèles aux spécifications erronées 4. Conclusions

Presque toutes les enquêtes sont touchées par la non-réponse; la méthode utilisée pour ajuster les poids de base pour la non-réponse totale est donc une question importante. L et V ont souligné à juste titre que l’utilisation de poids de sondage pour calculer un ajustement pondéré pour la non-réponse n’élimine pas le biais de non-réponse lorsque le mécanisme de réponse n’est pas spécifié correctement dans le modèle d’ajustement de la pondération. Toutefois, leur étude par simulation a porté au moins certains chercheurs à penser qu’un ajustement non pondéré pourrait mieux convenir qu’un ajustement pondéré dans la plupart des cas. Les résultats de notre évaluation, fondée sur le même scénario que celui de L et V, contredit cette perception. Nous avons examiné de façon plus approfondie les différences entre les estimateurs avec et sans pondération lorsque le modèle d’ajustement est inexact en utilisant le même scénario que L et V et en incluant différents taux d’échantillonnage et estimations des totaux et des domaines, en plus des moyennes étudiées par L et V.

Ces simulations élargies montrent que les ajustements avec et sans pondération ont effectivement des propriétés différentes. Le biais de l’estimateur pondéré des moyennes des totaux de plans d’échantillonnage aléatoires simples stratifiés est à peu près constant, quel que soit le taux d’échantillonnage, tandis que le biais de l’estimateur non pondéré dépend du taux d’échantillonnage. En revanche, le biais de l’estimateur non pondéré du total est considérablement plus important que celui de l’estimateur pondéré pour certains taux d’échantillonnage. Pour les moyennes, le biais et la reqm des deux estimateurs ne sont pas très différents, y compris pour les configurations que L et V ont décrites comme étant favorables à l’estimateur non pondéré. Les mêmes conclusions générales se vérifient pour les estimations des moyennes et des totaux de domaines à mesure que la moyenne pondérée se rapproche de plus en plus d’une estimation par ratio pour les domaines, ce qui finit par influencer quelque peu son comportement.

Nous avons aussi examiné l’estimation des tailles de domaine. Pour ce type de statistique, la reqm de l’estimateur pondéré est presque systématiquement inférieure à celle de l’estimateur non pondéré lorsque les données du scénario de simulation ne sont pas de type MAR. Les différences sont attribuables au biais de l’estimateur non pondéré de la taille de domaine; à cause de ce biais, l’estimateur non pondéré est assorti d’une reqm beaucoup plus grande que celle de l’estimateur pondéré pour certains taux d’échantillonnage.

Les modèles utilisés dans la plupart des enquêtes sont imparfaits; il est donc important de choisir la bonne méthode d’ajustement pour la non-réponse. Les résultats de la simulation élargie que nous présentons montrent que l’ajustement pondéré présente des avantages considérables pour certaines estimations et certains taux d’échantillonnage, comparativement à l’ajustement non pondéré. Plus particulièrement, une enquête selon le même plan qui produit des estimations des totaux et des statistiques autres que de simples moyennes semble bénéficier d’une pondération de l’ajustement. Bien sûr, la pondération de l’ajustement n’élimine pas le biais; elle diminue toutefois l’ampleur du biais dans bon nombre de situations et pour beaucoup des estimateurs que nous avons examinés. En outre, le biais de l’estimateur pondéré n’est pas sensible au taux d’échantillonnage relatif, alors que le biais de l’estimateur non pondéré l’est. L’inconvénient possible d’une augmentation de la variance de l’estimation lorsqu’on utilise un ajustement pondéré ne s’est pas concrétisé durant les simulations, et on peut l’éviter en examinant les facteurs d’ajustement, ce qu’il convient également de faire lorsqu’on utilise un ajustement non pondéré. Enfin, les résultats de l’étude font ressortir le problème potentiel de la généralisation à partir de simulations. Même si les simulations constituent un outil précieux pour vérifier un point précis, une généralisation à plus grande échelle des résultats d’une simulation peut être trompeuse, particulièrement lorsque les résultats dépendent fortement des conditions du modèle utilisé pour la simulation.

Bibliographie

Bethlehem, J.G. (1988). Reduction of nonresponse bias through regression estimation. Journal of Official Statistics, 4, 251-260.

Brick, J.M. (2013). Unit nonresponse and weighting adjustments: A critical review. Journal of Official Statistics, 29(2), 329-353.

Brick, J., et Jones, M. (2008). Propensity to respond and nonresponse bias. Metron-International Journal of Statistics, LXVI, 51-73.

Chadborn, T.R., Baster, K., Delpech, V., Sabin, C.A., Sinka, K., Rice, B.D. et Evans, B. (2005). No time to wait: How many HIV-infected homosexual men are diagnosed late and consequently die? (England and Wales, 1993-2002). Aids, 19(5), 513-520.

Grau, E., Potter, F., Williams, S. et Diaz-Tena, N. (2006). Nonresponse adjustment using logistic regression: To weight or not to weight? Proceedings of the Survey Research Methods Section, American Statistical Association, 3073-3080.

Haukoos, J.S., et Newgard, C.D. (2007). Advanced statistics: Missing data in clinical research - part 1: An introduction and conceptual framework. Academic Emergency Medicine, 14(7), 662-668.

Kalton, G. (1983). Introduction to Survey Sampling, SAGE University Paper 35. Thousand Oaks, CA: SAGE Publications.

Kott, P. (2012). Pourquoi les poids de sondage devraient être intégrés dans la correction de la non-réponse totale fondée sur des groupes de réponse homogènes. Techniques d’enquête, 38, 1, 103-107.

Kovačević, M., et Yung, W. (1997). Estimation de la variance des mesures de l’inégalité et de la polarisation du revenu - Étude empirique. Techniques d’enquête, 23, 1, 47-59.

Kreuter, F., Olson, K., Wagner, J., Yan, T., Ezzati-Rice, T.M., Casas-Cordero, C., Lemay, M., Peytchev, A., Groves, R.M. et Raghunathan, T.E. (2010). Using proxy measures and other correlates of survey outcomes to adjust for non-response: Examples from multiple surveys. Journal of the Royal Statistical Society Series A, Royal Statistical Society, 173(2), 389-407.

Little, R.J. (1986). Survey nonresponse adjustments. Revue Internationale de Statistique, 54, 139-157.

Little, R.J., et Rubin, D.B. (2002). Statistical Analysis with Missing Data (2nd Ed.). New York : John Wiley & Sons, Inc.

Little, R., et Vartivarian, S. (2003). On weighting the rates in nonresponse weights. Statistics in Medicine, 22, 1589-1599.

R Development Core Team (2011). R: A language and environment for statistical computing. R Foundation for Statistical Computing. Vienna, Austria. doi: http://www.R-project.org.

Särndal, C.-E., et Lundström, S. (2005). Estimation in Surveys with Nonresponse. Chichester, England : John Wiley & Sons, Inc.

Särndal, C.-E., Swensson, B. et Wretman, J. (1992). Model Assisted Survey Sampling. New York : Springer.

Sukasih, A., Jang, D., Vartivarian, S., Cohen, S. et Zhang, F. (2009). A simulation study to compare weighting methods for nonresponses in the National Survey of Recent College Graduates. Proceedings of the Survey Research Methods Section, American Statistical Association. Récupéré le 21 octobre 2013, à partir de www.amstat.org/sections/srms/proceedings/y2009/Files/304345.pdf.

Tremblay, V. (1986). Critères pratiques pour la définition des classes de pondération. Techniques d’enquête, 12, 1, 91-103.

West, B.T. (2009). A simulation study of alternative weighting class adjustments for nonresponse when estimating a population mean from complex sample survey data. Proceedings of the Survey Research Methods Section, American Statistical Association. Récupéré le 21 octobre 2013, à partir de www.amstat.org/sections/srms/proceedings/y2009/Files/305394.pdf.

Wun, L.-M., Ezzati-Rice, T.M., Diaz-Tena, N. et Greenblatt, J. (2007). On modelling response propensity for dwelling unit (DU) level non-response adjustment in the Medical Expenditure Panel Survey (MEPS). Statistics in Medicine, 26(8), 1875-1884.

Date de modification :