Mesure de l’incertitude associée aux estimateurs pour petits domaines basés sur un modèle
Section 5. Étude en simulation
À la
présente section, nous donnons les résultats d’études en simulation limitées
des propriétés sous le plan des estimateurs composites proposés de l’EQM. La
section 5.1 présente les résultats pour le modèle au niveau du domaine, et
la section 5.2, pour le modèle au niveau de l’unité.
5.1 Modèle au niveau
du domaine
En
adoptant la configuration de simulation utilisée par Datta et coll.
(2011), nous employons le modèle (2.1) avec
domaines,
pour
où les valeurs des covariables
sont générées indépendamment à partir de la
loi
et maintenues fixes au cours des simulations.
En outre,
et les valeurs de la variance
d’échantillonnage sont (2,0; 0,6; 0,5; 0,4; 0,2), avec
chaque valeur différente de
attribuée à six domaines consécutifs. En
notant que
nous générons
à partir du modèle de liaison
et maintenons les valeurs fixes au cours des
simulations pour refléter l’approche basée sur le plan avec conditionnement sur
les moyennes de domaine
Puis,
échantillons simulés
sont générés à partir du modèle
d’échantillonnage
avec l’erreur d’échantillonnage
générée à partir de la loi
pour la variance d’échantillonnage spécifiée
, qui est supposée fixe et connue.
Nous notons que notre configuration de simulation n’est pas exactement basée
sur le plan, mais qu’elle « s’en approche suffisamment » pour les
besoins de notre étude.
Partant
des données simulées
nous calculons les estimations EB
et obtenons une approximation de l’EQM de
sous la forme
Nous
calculons les estimateurs de l’EQM pour chaque échantillon simulé et prenons
leur moyenne sur les 100 000 simulations. Nous désignons les
moyennes des estimateurs de l’EQM sur les simulations par
et
ce qui correspond aux estimateurs de l’EQM
sous le modèle, sans biais sous le plan, sans biais sous le plan modifié,
composite modifié 1 et composite modifié 2, respectivement. Le biais
relatif (BR) de
est donné par
où
est donné par (5.1). Le biais relatif absolu
(BRA) est simplement défini comme étant
Les termes
et
sont définis de la même manière.
Nous
calculons aussi la racine carrée de l’erreur quadratique moyenne relative
(REQMR) des estimateurs de l’EQM sur les simulations. Nous désignons ces
valeurs par
et
pour les estimateurs de l’EQM sous le modèle,
sans biais sous le plan, sans biais sous le plan modifié, composite
modifié 1 et composite modifié 2, respectivement. Ici, la REQMR de
l’estimateur de l’EQM sous le modèle est définie comme étant
Les
REQMR des autres estimateurs de l’EQM sont définies de manière similaire.
Nous
commençons par comparer la moyenne des
sur l’ensemble des domaines à la moyenne des
sur l’ensemble des domaines. Nous obtenons les
valeurs 0,42 et 0,35, respectivement, ce qui montre que la moyenne de
l’estimateur de l’EQM sous le modèle, 0,42, est assez proche de la moyenne des
EQM sous le plan des estimateurs EB, 0,35, ce qui confirme le résultat
théorique mentionné à la section 4.1. Le résultat théorique s’appuie sur
l’hypothèse que les paramètres du modèle sont connus, tandis que la simulation
traite le cas général de paramètres du modèle inconnus.
Nous
examinons ensuite la probabilité d’obtenir une valeur négative pour les trois
estimateurs de l’EQM suivants : sans biais sous le plan, composite 1
et composite 2. La figure 5.1 montre le pourcentage de valeurs négatives sur
l’ensemble des simulations pour chacun des 30 domaines. Cette figure montre clairement que la
probabilité d’obtenir une valeur négative pour l’estimateur de l’EQM sans biais
sous le plan peut être aussi élevée que 50 % pour les six premiers
domaines (groupe 1), avec une variance d’échantillonnage beaucoup plus
grande que pour les domaines restants (groupe 2). Par ailleurs, cette
probabilité est négligeable pour les domaines du groupe 2. La probabilité
moyenne sur les domaines du groupe 1 est de 45,67 %
comparativement à 0,03 % pour le groupe 2. La probabilité d’obtenir
une valeur négative pour l’estimateur composite 1 de l’EQM est nulle sur
l’ensemble des 30 domaines, tandis que la probabilité moyenne pour
l’estimateur composite 2 de l’EQM est de 9,15 % sur les domaines
du groupe 1 et nulle sur les domaines du groupe 2. Les résultats
susmentionnés donnent à penser que l’estimateur composite 1 de l’EQM
pourrait ne pas nécessiter de modification, même pour des domaines pour
lesquels la variance d’échantillonnage est grande. Notons que, dans la présente
étude en simulation, les estimateurs composite 1 et composite
modifié 1 de l’EQM sont identiques, parce qu’aucune valeur nulle n’a été
décelée pour l’estimateur composite 1 de l’EQM.

Description de la figure 5.1
Graphique linéaire présentant le pourcentage de valeurs négatives des estimateurs de l’EQM où le modèle est au niveau du domaine. Le pourcentage de valeurs négatives allant de 0 à 55 %, est sur l’axe des y. Les domaines de 1 à 30 sont sur l’axe des x. Les trois courbes du graphiques sont les estimateurs de l’EQM suivants : sans biais sous le plan, composite 1 et composite 2. Pour les trois estimateurs, le pourcentage de valeurs négatives est à 0 à partir du domaine 7. Pour les domaines 1 à 6, le pourcentage de valeurs négatives oscille entre 35 et 50 % pour l’estimateur sans biais sous le plan, oscille entre 1 et 14 % pour l’estimateur composite 2 et est à 0 pour l’estimateur composite 1.
Examinons maintenant le BRA des estimateurs de
l’EQM. La figure 5.2 donne les valeurs du BRA pour chacun
des 30 domaines pour les estimateurs de l’EQM suivants : sous le
modèle, sans biais sous le plan, sans biais sous le plan modifié, composite 1
modifié et composite 2 modifié. Le tableau 5.1 donne le BRA sous le
plan moyen en %, ainsi que la REQMR sous le plan moyenne en % sur les
domaines du groupe 1 et du groupe 2.

Description de la figure 5.2
Graphique linéaire présentant le BRA en pourcentage des estimateurs de l’EQM où le modèle est au niveau du domaine. Le BRA allant de 0 à 140 %, est sur l’axe des y. Les domaines de 1 à 30 sont sur l’axe des x. Les cinq courbes du graphiques sont les estimateurs de l’EQM suivants : sous le modèle, sous le plan, sous le plan modifié, composite 1 modifié et composite 2 modifié. Le BRA de l’estimateur sans biais sous le plan est nul (hormis les erreurs de simulation) dans tous les domaines. Par ailleurs, le BRA de l’estimateur sans biais sous le plan modifié de l’EQM est grand pour les six premiers domaines, la valeur moyenne étant de 93,49 %, mais il est négligeable pour les autres domaines (0,38 %). L’estimateur de l’EQM sous le modèle présente aussi un grand BRA pour les six premiers domaines, la moyenne étant de 51,66 %, mais passe à 25,76 % pour les autres domaines. Dans le cas de l’estimateur composite 1 de l’EQM, la valeur moyenne du BRA est réduite à 34,08 % pour les domaines 1 à 6 et est petite pour les domaines 7 à 30 (7,60 %). L’estimateur composite 2 modifié de l’EQM réduit le BRA moyen à 32,00 % pour les six premiers domaines et à 4,13 % pour les autres domaines.
Tableau 5.1
BRA sous le plan moyen en % et REQMR sous le plan moyenne en % des estimateurs de l’EQM : modèle au niveau du domaine
Sommaire du tableau
Le tableau montre les résultats de BRA sous le plan moyen en % et REQMR sous le plan moyenne en % des estimateurs de l’EQM : modèle au niveau du domaine. Les données sont présentées selon Estimateur de l’EQM (titres de rangée) et BRA sous le plan moyen en % et REQMR sous le plan moyenne en %(figurant comme en-tête de colonne).
Estimateur de l’EQM |
BRA sous le plan moyen en % |
REQMR sous le plan moyenne en % |
Domaines 1 à 6 |
Domaines 7 à 30 |
Domaines 1 à 6 |
Domaines 7 à 30 |
Sous le plan |
0,33 |
0,39 |
246,71 |
33,62 |
Sous le plan modifié |
93,49 |
0,38 |
221,86 |
33,58 |
Sous le modèle |
51,66 |
25,76 |
54,98 |
26,61 |
Composite 1 modifié |
34,08 |
7,60 |
96,98 |
24,70 |
Composite 2 modifié |
32,00 |
4,13 |
146,31 |
28,20 |
Comme prévu, la figure 5.2 montre que le BRA
de l’estimateur sans biais sous le plan est nul (hormis les erreurs de
simulation) dans tous les domaines. Par ailleurs, étonnamment, le BRA de
l’estimateur sans biais sous le plan modifié de l’EQM est grand pour les six
premiers domaines, la valeur moyenne étant de 93,49 %, mais il est
négligeable pour les autres domaines (0,38 %). L’estimateur de l’EQM sous
le modèle présente aussi un grand BRA pour les six premiers domaines, la
moyenne étant de 51,66 %, mais passe à 25,76 % pour les
autres domaines. Dans le cas de l’estimateur composite 1 de l’EQM, la
valeur moyenne du BRA est réduite à 34,08 % pour le groupe 1 et
est petite pour le groupe 2 (7,60 %). L’estimateur composite 2
modifié de l’EQM, qui
donne plus de poids à l’estimateur sans biais sous le plan de l’EQM, réduit le
BRA moyen à 32,00 % pour le groupe 1 et à 4,13 % pour le
groupe 2.
La figure 5.3 donne le tracé de la REQMR des
estimateurs de l’EQM sur l’ensemble des 30 domaines et le tableau 5.1
donne les valeurs de la REQMR moyenne en % pour les domaines du
groupe 1 et du groupe 2. Comme prévu, l’estimateur de l’EQM sans
biais sous le plan affiche une très grande REQMR pour le groupe 1, la
valeur moyenne étant de 246,71 %. L’estimateur sans biais sous le
plan modifié de l’EQM est tout aussi instable pour le groupe 1 (REQMR
moyenne de 221,86 %) en plus de présenter un grand BRA. L’estimateur
de l’EQM sous le modèle est celui dont la REQMR est la plus petite, comme
prévu, la valeur moyenne étant de 54,98 % pour le groupe 1
comparativement à 96,98 % pour l’estimateur composite 1 de l’EQM et
à 146,31 % pour l’estimateur composite 2 modifié de l’EQM. Par
ailleurs, pour les domaines du groupe 2 dont les variances
d’échantillonnage sont plus petites, la REQMR moyenne est à peu près la même
pour les trois estimateurs de l’EQM, soit 24,70 % pour l’estimateur
composite 1, 26,61 % pour l’estimateur sous le modèle et 28,20 %
pour l’estimateur composite 2 modifié de l’EQM. La REQMR moyenne pour les
estimateurs de l’EQM sans biais sous le plan et sans biais sous le plan modifié
est à peine plus grande pour le groupe 2, les valeurs étant de 33,62 %
et 33,58 %, respectivement.
Enfin, nous nous tournons vers les taux de
couverture des intervalles de confiance pour une valeur nominale de 95 %.
Les taux de couverture selon la théorie normale pour l’estimateur de l’EQM sous
le modèle se calculent comme il suit
où
est une fonction indicatrice prenant la
valeur 1 si
est compris dans l’intervalle calculé et 0
autrement. Les taux de couverture pour les autres estimateurs de l’EQM sont
définis de manière similaire. La figure 5.4 donne le tracé des taux de
couverture en % pour les estimateurs de l’EQM. La courbe associée à
l’estimateur de l’EQM sans biais sous le plan n’est pas incluse dans le
graphique parce qu’il est impossible de calculer les taux de couverture des
intervalles de confiance en raison d’estimations négatives de l’EQM pour
certaines simulations. Le fait d’écarter ces simulations et de calculer les
intervalles pour les simulations restantes pourrait fausser le taux de
couverture.
Le graphique révèle une importante sous-couverture
pour les domaines du groupe 1 dont la variance d’échantillonnage est
grande. En particulier, le taux de couverture moyen pour les estimateurs sous
le modèle, composite 1 modifié et composite 2 modifié est de 68,53 %,
78,43 % et 72,87 %, respectivement, tandis que l’estimateur sous le
plan modifié de l’EQM présente une certaine amélioration, le taux étant
de 85,82 %. Par ailleurs, pour les domaines du groupe 2 dont les
variances d’échantillonnage sont plus petites, le taux de couverture moyen
augmente pour atteindre 91,73 %, 91,74 %, 90,89 % et 89,85 %
pour les estimateurs de l’EQM sous le modèle, composite 1 modifié,
composite 2 modifié et sous le plan modifié, respectivement. La
figure 5.4 donne à penser que les taux de couverture pour les estimateurs
sous le modèle et composites modifiés de l’EQM sont comparables pour tous les
domaines, ceux du groupe 1 présentant une sous-couverture importante en
raison des petites tailles d’échantillon ou des grandes variances
d’échantillonnage dans ces domaines.

Description de la figure 5.3
Graphique linéaire présentant la REQMR en pourcentage des estimateurs de l’EQM où le modèle est au niveau du domaine. La REQMR allant de 0 à 320 %, est sur l’axe des y. Les domaines de 1 à 30 sont sur l’axe des x. Les cinq courbes du graphiques sont les estimateurs de l’EQM suivants : sous le modèle, sous le plan, sous le plan modifié, composite 1 modifié et composite 2 modifié. Les estimateurs de l’EQM sans biais sous le plan et sans biais sous le plan modifié affichent une très grande REQMR pour le groupe 1, (REQMR moyenne de 246,71 et 221,86 % respectivement). L’estimateur de l’EQM sous le modèle est celui dont la REQMR est la plus petite, la valeur moyenne étant de 54,98 % pour le groupe 1 comparativement à 96,98 % pour l’estimateur composite 1 de l’EQM et à 146,31 % pour l’estimateur composite 2 modifié de l’EQM. Par ailleurs, pour les domaines du groupe 2, la REQMR moyenne est à peu près la même pour les trois estimateurs de l’EQM, soit 24,70 % pour l’estimateur composite 1, 26,61 % pour l’estimateur sous le modèle et 28,20 % pour l’estimateur composite 2 modifié de l’EQM. La REQMR moyenne pour les estimateurs de l’EQM sans biais sous le plan et sans biais sous le plan modifié est à peine plus grande pour le groupe 2, les valeurs étant de 33,62 % et 33,58 %, respectivement.

Description de la figure 5.4
Graphique linéaire présentant les taux de couverture en pourcentage des estimateurs de l’EQM où le modèle est au niveau du domaine. La REQMR allant de 70 à 100 %, est sur l’axe des y. Les domaines de 1 à 30 sont sur l’axe des x. Les quatre courbes du graphiques sont les estimateurs de l’EQM suivants : sous le modèle, sous le plan modifié, composite 1 modifié et composite 2 modifié. Le graphique révèle une importante sous-couverture pour les domaines du groupe 1 dont la variance d’échantillonnage est grande. En particulier, le taux de couverture moyen pour les estimateurs sous le modèle, composite 1 modifié et composite 2 modifié est de 68,53 %, 78,43 % et 72,87 %, respectivement, tandis que l’estimateur sous le plan modifié de l’EQM présente une certaine amélioration, le taux étant de 85,82 %. Par ailleurs, pour les domaines du groupe 2 dont les variances d’échantillonnage sont plus petites, le taux de couverture moyen augmente pour atteindre 91,73 %, 91,74 %, 90,89 % et 89,85 % pour les estimateurs de l’EQM sous le modèle, composite 1 modifié, composite 2 modifié et sous le plan modifié, respectivement.
5.2
Modèle au
niveau de l’unité
À la
présente section, nous présentons certains résultats d’une étude en simulation
limitée des propriétés par rapport au plan de sondage de quatre estimateurs de
l’EQM sous un simple modèle de moyenne au niveau de l’unité donné par
où
les effets aléatoires de domaine
sont indépendants des erreurs au niveau de
l’unité
Les estimateurs de l’EQM étudiés comprennent
l’estimateur de l’EQM sous le modèle
de l’estimateur EB
(Rao et Molina, 2015, section 7.2.3),
l’estimateur par substitution (plug-in)
de l’EQM sous le plan
obtenu à partir de (4.9) en remplaçant les
paramètres du modèle
et
par les estimateurs de leur REML, l’estimateur
de l’EQM composite donné par (4.10), et un estimateur
« conditionnel » de l’EQM,
proposé par Chambers, Chandra et Tzavidis
(2001, section 2.2.2).
Pour la
simulation basée sur le plan de sondage, nous utilisons
petits domaines et commençons par générer les
tailles de population de domaine
à partir d’une loi uniforme
et les maintenons fixes pour toutes les
simulations, à l’instar de Chambers et coll. (2011). Nous générons deux
populations finies fixes
à partir du modèle de moyenne (5.5) pour le
paramètre moyen spécifié
et les paramètres de variance
pour la première population finie (désignée
population A) et
pour la deuxième population finie (désignée
population B). Notons que le ratio des variances
est égal à 0,11 pour la population A
et est inférieur à 0,43 pour la population B. Ensuite, nous tirons des
échantillons aléatoires simples stratifiés
sans remise de chaque population finie, en
traitant chaque domaine comme une strate, où les tailles d’échantillon de
domaine sont choisies égales, soit
ou
En tout, nous tirons
échantillons aléatoires simples stratifiés et calculons les
estimations de l’EQM pour chaque échantillon. Indépendamment, nous tirons aussi
échantillons aléatoires stratifiés et
calculons les estimations EB d’après chaque échantillon. Une approximation
de l’EQM de l’estimateur EB pour chaque domaine est obtenue de manière
analogue à (5.1) en utilisant les 30 000 simulations. En utilisant un
grand nombre de simulations,
l’EQM empirique représente une bonne
approximation de l’EQM réelle de l’estimateur EB. Par ailleurs, un plus
petit nombre de simulations, tel que
est utilisé pour étudier la performance des
quatre estimateurs de l’EQM, afin de réduire les calculs. Cette configuration
de simulation en deux étapes est souvent utilisée pour le modèle au niveau de
l’unité (voir, p. ex., González-Manteiga, Lombardia, Molina, Morales et
Santamaria, 2008). Habituellement, le calcul de l’EQM est beaucoup plus rapide
que le calcul du BR et de la REQMR de plusieurs estimateurs de l’EQM, en
particulier les estimateurs bootstrap de l’EQM.
En
utilisant les estimations de l’EQM simulées et l’EQM de l’estimateur EB
simulé, nous calculons le biais relatif (BR), le biais relatif absolu (BRA) et
la racine carrée de l’erreur quadratique moyenne relative (REQMR) des
estimateurs de l’EQM de manière analogue à (5.2) et (5.3). Dans le cas de la
population A et d’une taille d’échantillon de domaine de 5,
l’estimateur par substitution de l’EQM sous le plan donne lieu à une
sous-estimation dans tous les domaines, le BR variant de -87,0 % à -18,1 %.
Cette sous-estimation est due au fait qu’il n’est pas tenu compte de la
variabilité des estimations des paramètres. Par ailleurs, l’estimateur de l’EQM
sous le modèle surestime généralement l’EQM sous le plan, le BR variant
de -66,4 % à 150,1 %. D’où, l’estimateur composite de l’EQM
réduit la sous-estimation causée par l’estimateur par substitution de l’EQM
sous le plan, le BR variant de -55,0 % à 115,4 %. L’estimateur de
l’EQM conditionnel surestime systématiquement l’EQM sous le plan, le BR variant
de 31,7 % à 316,1 %. La performance des estimateurs de l’EQM en
ce qui concerne le BR s’améliore à mesure que le ratio
s’élève vers 0,43 ou que la taille de
l’échantillon de domaine augmente pour atteindre 20.
Le
tableau 5.2 donne les valeurs médiane et moyenne du BRA pour les deux
populations et les deux tailles d’échantillon. Nous constatons que l’estimateur
composite de l’EQM donne de meilleurs résultats que les autres estimateurs pour
la population A et une taille de domaine de 5, les BRA médian et
moyen valant 53 %. Par contre, l’estimateur conditionnel de l’EQM
présente de grandes valeurs du BRA médian, soit 208 %, et du BRA
moyen, soit 191 %. Les valeurs médiane et moyenne du BRA pour tous
les estimateurs de l’EQM diminuent à mesure que le ratio
augmente pour atteindre 0,43 ou que la
taille d’échantillon diminue pour atteindre 20.
Tableau 5.2
BRA sous le plan médian et moyen en % des estimateurs de l’EQM : modèle au niveau de l’unité
Sommaire du tableau
Le tableau montre les résultats de BRA sous le plan médian et moyen en % des estimateurs de l’EQM : modèle au niveau de l’unité. Les données sont présentées selon Estimateurs de l’EQM (titres de rangée) et Population A, Population B et (équation)(figurant comme en-tête de colonne).
Estimateurs de l’EQM |
Population A |
Population B |
|
|
|
|
Médian |
Moyen |
Médian |
Moyen |
Médian |
Moyen |
Médian |
Moyen |
Sous le plan |
60,7 |
54,4 |
11,2 |
11,1 |
8,9 |
8,9 |
1,8 |
2,0 |
Conditionnel |
207,9 |
190,7 |
23,2 |
19,9 |
9,4 |
8,3 |
0,7 |
1,0 |
Sous le modèle |
77,4 |
81,7 |
44,0 |
38,8 |
29,6 |
28,4 |
6,8 |
8,6 |
Composite |
52,9 |
53,3 |
13,1 |
14,0 |
7,1 |
8,8 |
1,3 |
1,8 |
Le
tableau 5.3 donne les valeurs médiane et moyenne en % de la REQMR
sous le plan de sondage pour les deux populations et les deux tailles
d’échantillon. Il montre que l’estimateur de l’EQM sous le modèle et
l’estimateur de l’EQM composite donnent de meilleurs résultats que les autres
estimateurs de l’EQM, surtout pour la population A et la taille de domaine
de 5. Dans ce dernier cas, l’estimateur par substitution de l’EQM sous le
plan et l’estimateur conditionnel de l’EQM présentent de grandes valeurs
médianes et moyennes de la REQMR, soit environ 400 % contre 110 %
pour l’estimateur de l’EQM sous le modèle et l’estimateur de l’EQM composite.
La performance de tous les estimateurs de l’EQM s’améliore en ce qui concerne
la REQMR à mesure que le ratio
augmente ou que la taille d’échantillon de
domaine augmente. Dans le cas de la population B et de la taille de
domaine de 20, l’estimateur de l’EQM sous le modèle présente les plus
petites valeurs médiane et moyenne de la REQMR, soit environ 10 %
contre 30 % pour les autres estimateurs de l’EQM.
Tableau 5.3
REQMR sous le plan médiane et moyenne en % des estimateurs de l’EQM : modèle au niveau de l’unité
Sommaire du tableau
Le tableau montre les résultats de REQMR sous le plan médiane et moyenne en % des estimateurs de l’EQM : modèle au niveau de l’unité. Les données sont présentées selon Estimateurs de l’EQM (titres de rangée) et Population A, Population B et (équation)(figurant comme en-tête de colonne).
Estimateurs de l’EQM |
Population A |
Population B |
|
|
|
|
Médian |
Moyen |
Médian |
Moyen |
Médian |
Moyen |
Médian |
Moyen |
Sous le plan |
414,5 |
382,0 |
62,1 |
60,3 |
57,6 |
57,6 |
29,3 |
29,0 |
Conditionnel |
416,5 |
384,5 |
64,1 |
62,2 |
63,9 |
64,3 |
28,4 |
28,1 |
Sous le modèle |
107,8 |
108,5 |
45,4 |
41,6 |
31,6 |
31,7 |
8,9 |
10,8 |
Composite |
113,7 |
112,9 |
37,8 |
38,1 |
40,7 |
41,5 |
26,6 |
26,4 |