7. Expériences de simulation
Isabel Molina, J.N.K. Rao et Gauri Sankar Datta
Précédent | Suivant
Une étude par simulation a été conçue
en vue de répondre aux objectifs suivants :
- Étudier les propriétés, en termes de
biais et d’EQM, des estimateurs ETP quand
varie
pour une valeur fixe de
et quand
varie
pour une valeur fixe de
Nous
souhaitons déterminer quelles valeurs de
sont
adéquates pour une valeur donnée de
- Comparer les estimateurs ETP aux
EBLUP basés sur le MVRE et aux EBLUP basés sur le MVA.
- Étudier les propriétés des
estimateurs proposés de l’EQM en ce qui concerne le biais relatif, ainsi que la
couverture et la longueur des intervalles de prédiction.
- Comparer les trois estimateurs pour
petits domaines présentés qui attribuent un poids strictement positif à
l’estimateur direct pour tous les domaines, à savoir l’EBLUP fondé sur les
estimateurs MVA, TP-MVA et MVRE-MVA.
Pour réaliser les objectifs
susmentionnés, nous avons généré des données à partir du modèle de Fay-Herriot donné par les équations (2.1) et
(2.2) avec une moyenne constante, c’est-à-dire avec
et
Nous posons que
sans perte de généralité, que le nombre de
domaines est
et que
L’étude par simulation a été répétée pour des
valeurs croissantes de la variance du modèle,
ainsi que pour six seuils de signification du
test de
contre
à savoir
Pour chaque combinaison de
et
nous avons procédé aux étapes qui suivent pour
chaque exécution de la simulation
avec
exécutions :
-
Générer
les données au moyen du modèle hypothétique de moyenne nulle constante; c’est-à-dire
-
Calculer
les estimateurs suivants de
l’EBLUP
basé sur l’estimation du MVRE de
l’estimation ETP,
l’EBLUP
basé sur l’estimation du MVA de
l’estimation combinée TP-MVA
et
l’estimation MVRE-MVA
Pour
chaque domaine
calculer : les trois estimations de l’EQM
de l’EBLUP
données
dans (3.2), (3.3) et (4.1), désignées respectivement par
et
et les
trois estimations (6.3), (6.4) et (6.5) de l’EQM de l’estimateur combiné pour
petits domaines
désignées
et
respectivement.
Pour
chaque domaine
obtenir
les intervalles de prédiction
fondés
sur l’hypothèse de normalité pour la moyenne de petit domaine
basée
sur les trois estimateurs considérés de l’EQM de l’EBLUP :
où
est la
valeur critique supérieure au seuil
d’une loi
normale centrée réduite.
Répéter
les étapes 1 à 4 pour
pour
Puis,
pour chaque estimateur pour petits domaines
calculer
le biais et l’EQM empiriques sous la forme
Obtenir ensuite la moyenne sur les domaines des
biais et des EQM absolus sous la forme
Calculer
le biais relatif de chaque estimateur de l’EQM,
comme il
suit
Calculer la moyenne sur les domaines des biais
relatifs absolus sous la forme
Pour
chaque type d’intervalle de prédiction
pour
donné à
l’étape 4, calculer le taux de couverture (TC) et la longueur moyenne (LM)
empiriques comme il suit
Enfin, calculer la moyenne sur les domaines des
taux de couverture et des longueurs moyennes, comme il suit
Les figures 7.1 et 7.2
représentent graphiquement les EQM moyennes des estimateurs ETP pour chaque valeur
de
ainsi que l’EQM moyenne des EBLUP basés sur le
MVRE et le MVA en fonction du seuil de signification
Notons que, quand la valeur de
est petite, pour une grande valeur de
la procédure TP donne lieu plus souvent au
rejet de
et par conséquent l’estimateur ETP devient
plus fréquemment l’EBLUP usuel, tandis que si la valeur de
est faible, la procédure TP donne lieu moins
fréquemment au rejet de
et l’estimateur synthétique de type régression
est alors utilisé plus souvent. Par contre, pour une grande valeur de
l’estimateur ETP devient plus fréquemment
l’EBLUP quelle que soit la valeur de
Les biais absolus des estimateurs ne sont pas
présentés ici, parce qu’ils sont à peu près les mêmes pour tous les estimateurs
ETP pour les différentes valeurs de
Il en est ainsi parce que, quand le modèle est
vérifié, les deux composantes de l’estimateur ETP, l’estimateur synthétique et
l’EBLUP, sont sans biais pour le paramètre étudié. Notons que l’estimateur
synthétique est sans biais même quand
La première conclusion qui se dégage des
figures 7.1 et 7.2 est que l’EQM de l’estimateur ETP est pratiquement
constante pour les diverses valeurs de
Nous voyons aussi que l’EQM moyenne de
l’estimateur ETP pour une valeur donnée de
augmente avec
parce que l’estimateur ETP se réduit plus
fréquemment à l’EBLUP quand
augmente et que l’EQM de l’EBLUP augmente avec
Observons aussi que l’estimateur ETP et
l’EBLUP basé sur le MVRE donnent des résultats très similaires pour
Cependant, pour
l’estimateur ETP devient plus efficace que
l’EBLUP aussitôt que
s’approche de l’hypothèse nulle
ce qui concorde avec la remarque de Datta et coll. (2011).
Pour l’EBLUP basé sur le MVA, les
figures 7.1 et 7.2 montrent que l’EQM moyenne est considérablement plus
grande que celles des deux autres estimateurs, mais que les écarts par rapport
aux autres diminuent à mesure que
augmente. Cette situation est attribuable au biais de l’estimateur MVA de
quand la valeur de
est petite. Nous étudierons plus loin les
estimateurs pour petits domaines combinés TP-MVA et MVRE-MVA, qui n’utilisent
l’EBLUP basé sur le MVA que si l’hypothèse nulle n’est pas rejetée ou que
l’estimation réalisée de
est nulle.
Figure 7.1 EQM moyennes de
l’ETP, de l’EBLUP basé sur le MVRE et de l’EBLUP basé sur le MVA en fonction de
pour a)
et b)

Description de la figure 7.1
Datta
et coll. (2011, page 366) ont recommandé
d’utiliser
pour l’ETP. En outre, selon la littérature sur
l’estimation TP pour les modèles à effets fixes, un bon choix de
en ce qui concerne le biais et l’EQM est
(Bancroft
1944; Han et Bancroft 1968). Cependant, les résultats
susmentionnés donnent à penser que, pour
l’estimateur ETP est pratiquement le même que
l’EBLUP et qu’on pourrait par conséquent choisir de toujours utiliser l’EBLUP.
Figure 7.2 EQM moyennes de l’ETP, de l’EBLUP basé sur le
MVRE et de l’EBLUP basé sur le MVA en fonction de
pour

Description de la figure 7.2
Nous allons maintenant étudier les
propriétés de l’estimateur ETP pour l’estimation de l’EQM en fonction de
La figure 7.3 représente graphiquement le
biais relatif absolu moyen des estimateurs de l’EQM
étiqueté TP en fonction du seuil de
signification
pour chaque valeur
Lorsque l’on choisit
très petit
l’hypothèse nulle
est rejetée moins fréquemment et
devient souvent égal à
ce qui entraîne une sous-estimation. Pour une
grande valeur de
l’hypothèse nulle est rejetée plus fréquemment
et
devient l’estimateur usuel de l’EQM de
l’EBLUP, qui surestime fortement la valeur de l’EQM quand
est petite. La valeur
semble être un bon compromis, avec un biais
relatif absolu moyen de l’ordre de 10 % pour
et de 20 % pour
Figure 7.3 Moyenne sur les domaines des biais relatifs
absolus de l’estimateur de l’EQM
étiqueté
TP, pour
en
fonction du seuil de signification

Description de la figure 7.3
Les résultats susmentionnés donnent à
penser que
est un bon choix lorsqu’on utilise la
procédure TP pour estimer l’EQM de l’EBLUP usuel. Cette constatation a été
étudiée de manière plus approfondie en examinant les biais relatifs (affectés
d’un signe) de
pour chaque domaine. Ces résultats sont
représentés graphiquement aux figures 7.4 et 7.5, avec quatre graphiques,
un pour chaque valeur de
Les chiffres qui figurent dans les légendes de
ces graphiques sont les seuils de signification
pour l’estimateur ETP de l’EQM
Ces graphiques confirment nos observations
antérieures, à savoir que l’estimateur de l’EQM fondé sur l’ETP,
sous-estime
pour les faibles valeurs de
et la surestime pour les grandes valeurs de
Il s’avère que
avec
convient bien pour toutes les valeurs de
Figure 7.4 Biais relatif de
pour
chaque seuil de signification
en
fonction du domaine
pour a)
et b)

Description de la figure 7.4
Figure 7.5 Biais relatif de
pour
chaque seuil de signification
en
fonction du domaine
pour a)
et b)

Description de la figure 7.5
Comparons maintenant
pour le seuil de signification
choisi de
aux deux autres estimateurs
de l’EQM,
et
donnés par (3.3) et (3.2), respectivement. La
figure 7.6 représente graphiquement les biais relatifs absolus moyens des
trois estimateurs de l’EQM, étiquetés respectivement TP, MVRE0 et MVRE. Nous
constatons que
donne de meilleurs résultats
que
pour tous les domaines, mais que
demeure meilleur que
pour toutes les valeurs considérées
de
sauf
valeur
pour laquelle les différences entre les trois estimateurs
sont négligeables. Les écarts diminuent à mesure que
augmente, mais soulignons que
l’estimateur de l’EQM usuel,
peut être sévèrement biaisé
si la valeur de
est petite, avec un biais
relatif absolu moyen supérieur à 50 % pour
et croissant exponentiellement quand
tend vers zéro. La conclusion est que, quand
n’est pas rejetée, même si l’estimation
réalisée de
est positive, il semble préférable d’omettre le terme
dans l’estimateur de l’EQM et
de ne considérer que
Figure 7.6 Moyenne sur les domaines des biais relatifs
absolus des estimateurs de l’EQM
avec
étiqueté
TP,
étiqueté
MVRE et
étiqueté
MVRE0, en fonction de

Description de la figure 7.6
Examinons maintenant les estimateurs pour
petits domaines qui appliquent un poids strictement positif à l’estimateur
direct pour tous les domaines, à savoir l’EBLUP basé sur le MVA,
et les deux estimateurs combinés, TP-MVA donné
en (6.1) et MVRE-MVA donné en (6.2). Les EQM moyennes sont représentées graphiquement
à la figure 7.7 pour ces trois estimateurs. Dans ce graphique,
semble être un peu moins
efficace, et est suivi par TP-MVA. L’estimateur combiné MVRE-MVA semble donner
d’un peu meilleurs résultats que les deux
autres pour une faible valeur de
quoique pour
l’estimateur TP-MVA est
très proche. Pour l’estimation de l’EQM, nous nous concentrons sur l’estimateur
MVRE-MVA en raison de sa meilleure performance.
Figure 7.7 Moyenne sur les domaines des EQM pour
l’estimateur TP-MVA avec
l’EBLUP
basé sur le MVA et l’estimateur MVRE-MVA en fonction de

Description de la figure 7.7
Pour l’estimateur combiné MVRE-MVA, la
figure 7.8 montre que l’estimateur de l’EQM basé sur le test préliminaire
TP,
qui utilise seulement
quand
ou que l’hypothèse nulle n’est pas rejetée, présente
un biais relatif absolu moyen inférieur à 10 % pour
et est plus faible que les valeurs correspondantes
pour
et
spécialement pour
Figure 7.8 Moyenne sur les domaines des biais relatifs
absolus des estimateurs de l’EQM
et
étiquetés respectivement MVRE-MVA, MVRE-MVA0
et TP, en fonction de

Description de la figure 7.8
Enfin, nous analysons la moyenne sur les
domaines des taux de couverture et des longueurs moyennes des intervalles de
prédiction fondés sur l’hypothèse de normalité pour la moyenne de petit domaine
en utilisant l’EBLUP basé sur
le MVRE comme estimation ponctuelle et les trois estimateurs différents de
l’EQM de l’EBLUP, à savoir
et
La figure 7.9 représente
les taux de couverture des trois types d’intervalles, où les estimateurs de l’EQM basés sur la procédure TP ont été
obtenus en prenant
Il semble que les bonnes propriétés de biais
relatif de l’estimateur de l’EQM basé sur la procédure TP,
pour une valeur faible de
ne peuvent pas être extrapolées
à la couverture basée sur les intervalles de prédiction normaux, et présentent
une sous-couverture surtout pour
Dans ce cas, choisir un seuil de signification
plus élevé,
réduit un peu la couverture
insuffisante des intervalles de prédiction obtenus en utilisant
Néanmoins, les taux de
couverture de
sont meilleurs pour toutes
les valeurs de
Comme prévu, l’estimateur usuel
de l’EQM
donne une surcouverture pour
les petites valeurs de
laquelle résulte de la forte
surestimation de l’EQM. Par ailleurs, les intervalles pour lesquels on observe
une sous-couverture entraînent aussi des intervalles de prédiction plus courts,
comme le montre la figure 7.10.
Il est utile de mentionner que la
construction des intervalles de prédiction pour
basés sur le modèle de Fay-Herriot avec des taux de couverture exacts n’est pas une tâche
évidente. Plusieurs articles traitant de ce problème ont été publiés. Par
exemple, Chatterjee, Lahiri et Li (2008)
ont proposé des intervalles de prédiction avec taux de couverture corrects
jusqu’à l’ordre deux en utilisant uniquement le terme
comme estimation de l’EQM et en
appliquant une procédure bootstrap pour trouver les quantiles calés. Diao, Smith, Datta, Maiti et Opsomer (2014) ont
obtenu récemment des intervalles de prédiction avec taux de couverture corrects
jusqu’à l’ordre deux en évitant d’utiliser des procédures de rééchantillonnage et
en utilisant l’estimateur complet de l’EQM. L’obtention d’intervalles de
prédiction dont la couverture est exacte en utilisant d’autres estimations de
l’EQM pose encore des difficultés et dépasse le cadre du présent article.
Figure 7.9 Moyenne sur les domaines des taux de
couverture des intervalles de prédiction fondés sur la normalité pour
en
utilisant les estimateurs de l’EQM
et
avec
étiquetés respectivement MVRE, MVRE0 et TP, en
fonction de

Description de la figure 7.9
Figure 7.10 Moyenne sur les domaines des longueurs moyennes
des intervalles basés sur l’hypothèse de normalité pour
en
utilisant les estimateurs de l’EQM
et
avec
étiquetés respectivement MVRE, MVRE0 et TP, en
fonction de

Description de la figure 7.10
L’étude par simulation dont la
description précède a été répétée pour plusieurs profils de variances
d’échantillonnage inégales
Les résultats ne sont pas
présentés ici, mais les conclusions sont très semblables à condition que le
profil de variance ne soit pas extrêmement irrégulier.
Précédent | Suivant