Développer des arbres de régression qui utilisent les covariables de la base de sondage pour explorer le fardeau de réponse afin d’établir le plan d’enquête - ARCHIVÉ

Articles et rapports : 11-522-X202100100024

Description : La Direction des études économiques du U.S. Census Bureau élabore des procédures coordonnées de plan et de sélection des échantillons pour son Annual Integrated Economic Survey (AIES, Enquête économique annuelle intégrée). L’échantillon unifié remplacera la pratique actuelle de la Direction qui consiste à élaborer de façon indépendante des bases de sondage et des procédures d’échantillonnage pour une série d’enquêtes annuelles distinctes, ce qui optimise les caractéristiques du plan d’échantillonnage au prix d’un fardeau de réponse accru. Les attributs de taille des populations d’entreprises (p. ex. les revenus et l’emploi) sont considérablement biaisés. Un pourcentage élevé d’entreprises exercent au sein de plusieurs secteurs. De nombreuses entreprises sont donc échantillonnées dans le cadre de multiples enquêtes; ce qui accroît le fardeau de réponse, en particulier pour les entreprises de taille moyenne.

Même si cette composante de fardeau de réponse est réduite en sélectionnant un seul échantillon coordonné, elle n’est pas entièrement supprimée. Le fardeau de réponse dépend de plusieurs facteurs, notamment (1) de la longueur et la complexité du questionnaire, (2) de l’accessibilité des données, (3) du nombre attendu de mesures répétées et (4) de la fréquence de la collecte. Le plan de sondage peut avoir des répercussions profondes sur les troisième et quatrième facteurs. Pour contribuer aux décisions relatives au plan de sondage intégré, nous utilisons des arbres de régression afin de relever les covariables de la base de sondage associées au fardeau de réponse. En utilisant une base et des données de réponse historiques provenant de quatre enquêtes échantillonnées indépendamment, nous mettons à l’essai divers algorithmes, puis dressons des arbres de régression qui expliquent les relations entre les niveaux attendus de fardeau de réponse (tels qu’ils sont mesurés par le taux de réponse) et les covariables de base communes à plusieurs enquêtes. Nous validons les constats initiaux par une validation croisée, en examinant les résultats au fil du temps. Enfin, nous faisons des recommandations sur la façon d’intégrer nos résultats robustes au plan de sondage coordonné.
Numéro d'exemplaire : 2021001
Auteur(s) : Bechtel, Laura; Willimack, Diane K.; Xiong, Yeng; Viehdorfer, Colt S.
FormatDate de sortieInformations supplémentaires
PDF29 octobre 2021

Information connexe

Sujets et mots-clés

Sujets

Date de modification :