Techniques d’enquête
Efficacité relative des méthodes fondées sur l’estimation par régression d’enquête assistée par un modèle : une étude par simulations
par Erin R. Lundy et J.N.K. RaoNote 1
- Date de diffusion : le 21 juin 2022
Résumé
L’utilisation de données auxiliaires pour améliorer l’efficacité des estimateurs de totaux et de moyennes grâce à l’estimation par régression d’enquête assistée par un modèle a suscité un grand intérêt au cours de ces dernières années. Les estimateurs par la régression généralisée (ERG), basés sur un modèle de régression linéaire de travail, sont actuellement utilisés dans les enquêtes auprès d’établissements au sein de Statistique Canada et dans plusieurs autres organismes statistiques. Les estimateurs ERG utilisent des poids d’enquête communs à toutes les variables de l’étude et tiennent compte des totaux de population connus des variables auxiliaires. De plus en plus, de nombreuses variables auxiliaires sont disponibles, dont certaines peuvent être extérieures. Cela donne lieu des poids d’ERG fluctuants lorsque toutes les variables auxiliaires disponibles, y compris les interactions entre les variables catégorielles, sont utilisées dans le modèle de régression linéaire de travail. Par ailleurs, de nouvelles méthodes d’apprentissage automatique, comme les arbres de régression et les méthodes LASSO, sélectionnent automatiquement les variables auxiliaires significatives et donnent lieu à des poids non négatifs stables et à des gains d’efficacité possibles par rapport aux estimateurs ERG. Dans le présent article, une étude par simulations, basée sur un ensemble de données réelles d’une enquête réalisée auprès d’entreprises considérées comme la population cible, est menée pour étudier la performance relative des estimateurs ERG, des arbres de régression et des méthodes LASSO en matière d’efficacité des estimateurs et de propriétés des poids de régression connexes. Des scénarios d’échantillonnage probabiliste et d’échantillonnage non probabiliste sont étudiés.
Mots-clés : Inférence assistée par modèle; estimation par calage; sélection de modèles; estimateur par régression généralisée.
Table des matières
- Section 1. Introduction
- Section 2. Estimation assistée par un modèle selon un échantillonnage probabiliste
- Section 3. Étude par simulations fondée sur les données de l’Enquête sur le financement et la croissance des petites et moyennes entreprises
- Section 4. Résultats de l’étude par simulations
- Section 5. Estimation selon un échantillonnage non probabiliste
- Section 6. Conclusions
- Remerciements
- Bibliographie
Citation de l'article
Lundy, E.R., et Rao, J.N.K. (2022). Efficacité relative des méthodes fondées sur l’estimation par régression d’enquête assistée par un modèle : une étude par simulations. Techniques d’enquête, Statistique Canada, n° 12-001-X au catalogue, vol. 48, n° 1. Article accessible à l'adresse http://www.statcan.gc.ca/pub/12-001-x/2022001/article/00003-fra.htm.
Note
- Date de modification :