Critère de choix entre la pondération de calage et celle de sondage
Section 3. Critère proposé pour la mesure de l’effet de l’utilisation des poids de calage
L’utilisation des poids de calage vise à améliorer la précision des estimations des paramètres d’intérêt d’une enquête. Cette amélioration dépend en grande partie de degré du lien entre la variable d’intérêt et les variables de calage. Pour évaluer l’effet de l’utilisation des poids de calage, on peut se baser sur la comparaison des EQM anticipées des estimateurs et donnés respectivement par (2.5) et (2.10). Ainsi, l’effet de l’utilisation des poids de calage peut être mesuré par le critère suivant :
où le choix d’utiliser les poids de calage correspond au cas où la valeur de Weff est inférieure à 1. Notons que l’expression (3.1) de Weff dépend de la population et doit être estimée. De plus, pour tout représente la variance du poids de calage en considérant l’ensemble des échantillons contenant l’unité La variance est en général non nulle car les poids dépendent des variables de calage et donc de l’échantillon sélectionné. Afin de pouvoir tenir compte de la variance dans la mesure de l’effet de l’utilisation des poids de calage nous proposons d’estimer la quantité
par
où est l’estimateur de White de défini par avec L’estimateur (3.3) est obtenu en remplaçant par qui peut être vue comme une approximation de premier ordre de En effet, pour toute unité l’utilisation du calage produit un poids qui varie d’un échantillon à un autre mais dont l’espérance sous le plan peut être approximée par le poids de sondage Les simulations réalisées à la section 4 montrent que constitue un bon estimateur puisqu’il permet de déduire un estimateur performant du critère Weff. En effet, le critère Weff que nous proposons pour choisir entre l’utilisation des poids de calage et ceux de sondage peut être estimé par
où et est un estimateur de issu de l’approximation (2.8) et qui est donné par :
avec et Le critère proposé a l’avantage de tenir compte à travers du biais dû à l’utilisation des poids de calage ainsi que de la qualité du modèle de régression linéaire représentant le lien entre la variable d’intérêt et les variables de calage et ceci à travers la variance Notons que pour certains plans de sondage, la pondération utilisée classiquement pour l’estimation conduit bien à un estimateur sans biais sous le plan de sondage, mais qui n’est pas nécessairement l’estimateur HT. C’est le cas par exemple du plan de sondage à deux degrés où le plan de sondage de deuxième degré dépend de l’échantillon de premier degré et la pondération utilisée est le produit des poids de sondage de chacun des deux degrés. Il est important de préciser que le critère proposé dans ce papier n’est pas lié à l’estimateur HT car il permet de comparer l’estimateur par calage à tout estimateur utilisant les poids de sondage du moment qu’il est sans biais.
- Date de modification :