Critère de choix entre la pondération de calage et celle de sondage
Section 3. Critère proposé pour la mesure de l’effet de l’utilisation des poids de calage

Table des matières

L’utilisation des poids de calage vise à améliorer la précision des estimations des paramètres d’intérêt d’une enquête. Cette amélioration dépend en grande partie de degré du lien entre la variable d’intérêt et les variables de calage. Pour évaluer l’effet de l’utilisation des poids de calage, on peut se baser sur la comparaison des EQM anticipées des estimateurs ${\hat{t}}_{y C}$ et ${\hat{t}}_{y π}$ donnés respectivement par (2.5) et (2.10). Ainsi, l’effet de l’utilisation des poids de calage peut être mesuré par le critère suivant :

$Weff = \frac{\sum_{k \in U} σ_{k}^{2} [\frac{V_{k}}{d_{k}} + R_{k}^{2} (d_{k} - 1) + {(R_{k} - 1)}^{2}]}{V_{Approx} + \sum_{k \in U} σ_{k}^{2} d_{k} (1 - π_{k})} (3.1)$

où le choix d’utiliser les poids de calage correspond au cas où la valeur de Weff est inférieure à 1. Notons que l’expression (3.1) de Weff dépend de la population et doit être estimée. De plus, pour tout $k \in U,$ $V_{k}$ représente la variance du poids de calage $w_{k S , C}$ en considérant l’ensemble des échantillons $s$ contenant l’unité $k .$ La variance $V_{k}$ est en général non nulle car les poids $w_{k S , C}$ dépendent des variables de calage et donc de l’échantillon $s$ sélectionné. Afin de pouvoir tenir compte de la variance $V_{k}$ dans la mesure de l’effet de l’utilisation des poids de calage $w_{k S , C} ,$ nous proposons d’estimer la quantité

$V_{w} = \sum_{k \in U} σ_{k}^{2} \frac{V_{k}}{d_{k}} (3.2)$

par

${\hat{V}}_{w} = \sum_{k \in S} {\hat{σ}}_{k}^{2} {(w_{k S , C} - d_{k})}^{2} (3.3)$

où ${\hat{σ}}_{k}^{2}$ est l’estimateur de White de $σ_{k}^{2}$ défini par $n {\hat{ε}}_{k}^{2} / (n - p)$ avec ${\hat{ε}}_{k} = Y_{k} - x_{k}^{'} \hat{β} .$ L’estimateur (3.3) est obtenu en remplaçant $V_{k}$ par ${(w_{k S , C} - d_{k})}^{2}$ qui peut être vue comme une approximation de premier ordre de $V_{k} .$ En effet, pour toute unité $k \in U,$ l’utilisation du calage produit un poids $w_{k S , C}$ qui varie d’un échantillon à un autre mais dont l’espérance sous le plan peut être approximée par le poids de sondage $d_{k} .$ Les simulations réalisées à la section 4 montrent que ${\hat{V}}_{w}$ constitue un bon estimateur $V_{w}$ puisqu’il permet de déduire un estimateur performant du critère Weff. En effet, le critère Weff que nous proposons pour choisir entre l’utilisation des poids de calage $w_{k S , C}$ et ceux de sondage $d_{k}$ peut être estimé par

${\hat{Weff}}_{S} = \frac{\sum_{k \in S} d_{k} {\hat{σ}}_{k}^{2} [\frac{{(w_{k S , C} - d_{k})}^{2}}{d_{k}} + {\hat{R}}_{k S}^{2} (d_{k} - 1) + {({\hat{R}}_{k S} - 1)}^{2}]}{{\hat{V}}_{Approx , S} + \sum_{k \in S} d_{k} {\hat{σ}}_{k}^{2} (d_{k} - 1)} (3.4)$

où ${\hat{R}}_{k S} = w_{k S} / d_{k}$ et ${\hat{V}}_{Approx , S}$ est un estimateur de ${var}_{p} (\sum_{k \in S} d_{k} x_{k}^{'} β)$ issu de l’approximation (2.8) et qui est donné par :

${\hat{V}}_{Approx , S} = \sum_{k \in S} {\tilde{c}}_{k} {(d_{k} x_{k}^{'} \hat{β})}^{2} - \frac{1}{\hat{h}} {(\sum_{k \in S} {\tilde{c}}_{k} d_{k} x_{k}^{'} \hat{β})}^{2} (3.5)$

avec ${\tilde{c}}_{k} = n (1 - π_{k}) / (n - 1)$ et $\hat{h} = \sum_{k \in S} {\tilde{c}}_{k} .$ Le critère ${\hat{Weff}}_{S}$ proposé a l’avantage de tenir compte à travers ${\hat{R}}_{k S}$ du biais dû à l’utilisation des poids de calage ainsi que de la qualité du modèle de régression linéaire représentant le lien entre la variable d’intérêt et les variables de calage et ceci à travers la variance ${\hat{σ}}_{k}^{2} .$ Notons que pour certains plans de sondage, la pondération utilisée classiquement pour l’estimation conduit bien à un estimateur sans biais sous le plan de sondage, mais qui n’est pas nécessairement l’estimateur HT. C’est le cas par exemple du plan de sondage à deux degrés où le plan de sondage de deuxième degré dépend de l’échantillon de premier degré et la pondération utilisée est le produit des poids de sondage de chacun des deux degrés. Il est important de préciser que le critère ${\hat{Weff}}_{S}$ proposé dans ce papier n’est pas lié à l’estimateur HT car il permet de comparer l’estimateur par calage à tout estimateur utilisant les poids de sondage du moment qu’il est sans biais.

ISSN : 1712-5685

Politique de rédaction

Techniques d’enquête publie des articles sur les divers aspects des méthodes statistiques qui intéressent un organisme statistique comme, par exemple, les problèmes de conception découlant de contraintes d’ordre pratique, l’utilisation de différentes sources de données et de méthodes de collecte, les erreurs dans les enquêtes, l’évaluation des enquêtes, la recherche sur les méthodes d’enquête, l’analyse des séries chronologiques, la désaisonnalisation, les études démographiques, l’intégration de données statistiques, les méthodes d’estimation et d’analyse de données et le développement de systèmes généralisés. Une importance particulière est accordée à l’élaboration et à l’évaluation de méthodes qui ont été utilisées pour la collecte de données ou appliquées à des données réelles. Tous les articles seront soumis à une critique, mais les auteurs demeurent responsables du contenu de leur texte et les opinions émises dans la revue ne sont pas nécessairement celles du comité de rédaction ni de Statistique Canada.

Présentation de textes pour la revue

Techniques d’enquête est publiée en version électronique deux fois l’an. Les auteurs désirant faire paraître un article sont invités à le faire parvenir en français ou en anglais en format électronique et préférablement en Word au rédacteur en chef, (statcan.smj-rte.statcan@canada.ca, Statistique Canada, 150 Promenade du Pré Tunney, Ottawa, (Ontario), Canada, K1A 0T6). Pour les instructions sur le format, veuillez consulter les directives présentées dans la revue ou sur le site web (www.statcan.gc.ca/Techniquesdenquete).

Note de reconnaissance

Le succès du système statistique du Canada repose sur un partenariat bien établi entre Statistique Canada et la population, les entreprises, les administrations canadiennes et les autres organismes. Sans cette collaboration et cette bonne volonté, il serait impossible de produire des statistiques précises et actuelles.

Normes de service à la clientèle

Statistique Canada s'engage à fournir à ses clients des services rapides, fiables et courtois. À cet égard, notre organisme s'est doté de normes de service à la clientèle qui doivent être observées par les employés lorsqu'ils offrent des services à la clientèle.

Droit d'auteur

Publication autorisée par le ministre responsable de Statistique Canada.

L'utilisation de la présente publication est assujettie aux modalités de l'Entente de licence ouverte de Statistique Canada.

N° 12-001-X au catalogue

Périodicité : semi-annuel

Ottawa

Date de modification :: 2018-12-20

Sélection de la langue

Recherche et menus

Recherche

Critère de choix entre la pondération de calage et celle de sondage
Section 3. Critère proposé pour la mesure de l’effet de l’utilisation des poids de calage

Critère de choix entre la pondération de calage et celle de sondage Section 3. Critère proposé pour la mesure de l’effet de l’utilisation des poids de calage

Politique de rédaction

Présentation de textes pour la revue

Note de reconnaissance

Normes de service à la clientèle

Droit d'auteur

Critère de choix entre la pondération de calage et celle de sondage
Section 3. Critère proposé pour la mesure de l’effet de l’utilisation des poids de calage