Techniques d’enquête
Intégration de données d’enquêtes probabilistes et de mégadonnées aux fins d’inférence de population finie au moyen d’une imputation massive

par Shu Yang, Jae Kwang Kim et Youngdeok HwangNote 1

  • Date de diffusion : le 24 juin 2021

Résumé

À l’ère des mégadonnées, on dispose d’un nombre croissant de sources de données pour les analyses statistiques. Comme exemple important d’inférence de population finie, nous examinons une approche d’imputation pour la combinaison de données tirées d’une enquête probabiliste et de mégadonnées. Nous nous concentrons sur une situation où la variable à l’étude est observée dans les mégadonnées seulement, mais les autres variables auxiliaires sont couramment observées dans les deux sources de données. Contrairement à l’imputation habituellement utilisée pour l’analyse des données manquantes, nous créons des valeurs imputées pour toutes les unités de l’échantillon probabiliste. Une imputation massive de ce type est intéressante dans le contexte de l’intégration des données d’enquête (Kim et Rao, 2012). Nous étendons l’imputation massive comme outil d’intégration des données d’enquête et des mégadonnées ne provenant pas d’enquêtes. Nous présentons les méthodes d’imputation massive et leurs propriétés statistiques. De plus, l’estimateur d’appariement de Rivers (2007) est traité comme cas particulier. L’estimation de la variance au moyen de données obtenues par imputation massive est abordée. Les résultats de la simulation montrent que les estimateurs proposés donnent de meilleurs résultats que les estimateurs concurrents en matière de robustesse et d’efficacité.

Mots-clés :     Pondération par calage; fusion de données; modèle additif généralisé; appariement; imputation par le plus proche voisin; poststratification.

Table des matières

Citation de l'article

Yang, S., Kim, J.K. et Hwang, Y. (2021). Intégration de données d’enquêtes probabilistes et de mégadonnées aux fins d’inférence de population finie au moyen d’une imputation massive. Techniques d’enquête, Statistique Canada, n° 12-001-X au catalogue, vol. 47,  1. Article accessible à l'adresse http://www.statcan.gc.ca/pub/12-001-x/2021001/article/00004-fra.htm.

Note


Date de modification :