Progrès dans l’utilisation de l’information auxiliaire pour l’estimation à partir d’échantillons non probabilistes - ARCHIVÉ

Articles et rapports : 11-522-X202100100014

Description : De récents développements des modes d’administration de questionnaires et d’extraction de données ont favorisé l’utilisation d’échantillons non probabilistes, qui présentent souvent un biais de sélection découlant d’un manque de plan de sondage ou de l’autosélection des participants. Ce biais peut être traité par plusieurs ajustements, dont l’applicabilité dépend du type d’information auxiliaire disponible. Des poids de calage peuvent être utilisés lorsque seuls des totaux de population de variables auxiliaires sont disponibles. En cas de disponibilité d’une enquête de référence respectant un plan de sondage probabiliste, plusieurs méthodes peuvent être appliquées, comme l’ajustement sur le score de propension, l’appariement statistique ou l’imputation de masse, ainsi que des estimateurs doublement robustes. En cas de disponibilité d’un recensement complet de la population cible pour certaines covariables auxiliaires, des estimateurs fondés sur des modèles de superpopulation (souvent utilisés en échantillonnage probabiliste) peuvent être adaptés au cas d’échantillonnage non probabiliste. Nous avons étudié la combinaison de certaines de ces méthodes, afin de produire des estimations moins biaisées et plus efficaces, ainsi que l’utilisation de techniques de prédiction modernes (comme la classification par apprentissage automatique et des algorithmes de régression) dans les étapes de modélisation des ajustements décrits. Nous avons en outre étudié l’utilisation de techniques de sélection de variables avant l’étape de modélisation de l’ajustement sur le score de propension. Les résultats indiquent que les ajustements fondés sur la combinaison de plusieurs méthodes peuvent améliorer l’efficacité des estimations et que l’utilisation de l’apprentissage automatique et de techniques de sélection de variables peut contribuer à réduire le biais et la variance des estimateurs dans une plus grande mesure dans plusieurs situations.

Mots clés : échantillonnage non probabiliste; calage; ajustement sur le score de propension; appariement.

Numéro d'exemplaire : 2021001
Auteur(s) : Ferri-Garcia, Ramon
FormatDate de sortieInformations supplémentaires
PDF15 octobre 2021

Information connexe

Sujets et mots-clés

Sujets

Mots-clés

Date de modification :