Techniques d’enquête
Commentaires de Xiao-Li MengNote 1 à propos de l’article « Inférence statistique avec des échantillons d’enquête non probabiliste » : La miniaturisation de la corrélation due à un défaut des données : une stratégie polyvalente de traitement des échantillons non probabilistes

  • Date de diffusion : le 15 décembre 2022

Résumé

Il n’est pas possible de tirer parti de la puissante probabilité du plan pour établir l’inférence fondée sur la randomisation à partir d’échantillons non probabilistes. Cela nous incite à exploiter une probabilité divine naturelle qui accompagne toute population finie. Dans cette perspective, un des paramètres principaux est la corrélation due à un défaut des données (cdd), qui est la corrélation de la population finie sans modèle entre l’indicateur d’inclusion de l’échantillon de la personne et la caractéristique de la personne échantillonnée. Un mécanisme de génération de données équivaut à un échantillonnage probabiliste, en ce qui concerne l’effet de plan, si et seulement si la cdd correspondante est de l’ordre (stochastique) N-1/2, où N est la taille de la population (Meng, 2018). Par conséquent, les méthodes d’estimation linéaire valides existantes pour les échantillons non probabilistes peuvent être converties en plusieurs stratégies de miniaturisation de la cdd jusqu’à l’ordre N-1/2. Les méthodes quasi fondées sur le plan permettent d’accomplir cette tâche en réduisant la variabilité entre les N propensions d’inclusion au moyen d’une pondération. L’approche fondée sur un modèle de superpopulation permet d’atteindre le même objectif par la réduction de la variabilité des caractéristiques des N personnes en les remplaçant par leurs résidus issus d’un modèle de régression. Les estimateurs doublement robustes doivent la propriété dont ils portent le nom au fait qu’une corrélation est nulle chaque fois qu’une des variables corrélées est constante, quelle qu’elle soit. Comprendre les points communs de ces méthodes au moyen de la cdd nous aide à voir clairement la possibilité d’une « robustesse plus que double », c’est-à-dire une estimation valide qui ne dépend pas de la pleine validité du modèle de régression ni de la propension d’inclusion estimée, qui ne sont garanties ni l’une ni l’autre parce que les deux reposent sur la probabilité du procédé. Les renseignements générés par la cdd incitent également à un sous-échantillonnage de contrebalancement, une stratégie visant à créer une miniature de la population à partir d’un échantillon non probabiliste, et comportant un compromis de qualité et de quantité favorable parce que les erreurs quadratiques moyennes sont beaucoup plus sensibles à la cdd qu’à la taille de l’échantillon, en particulier pour les populations de grande taille.

Mots-clés : Biais de non-réponse; estimateurs d’enquête assistés par un modèle; indice de défaut des données; inférence fondée sur le plan de sondage; probabilité divine; probabilité du plan; probabilité du procédé.

Table des matières

Citation de l'article

Meng, X.-L. (2022). Commentaires à propos de l’article « Inférence statistique avec des échantillons d’enquête non probabiliste » : La miniaturisation de la corrélation due à un défaut des données : une stratégie polyvalente de traitement des échantillons non probabilistes. Techniques d’enquête, Statistique Canada, no 12-001-X au catalogue, vol. 48, no 2. Article accessible à l'adresse http://www.statcan.gc.ca/pub/12-001-x/2022002/article/00006-fra.htm.

Note


Date de modification :