Recherche par

7. Expériences de simulation

Isabel Molina, J.N.K. Rao et Gauri Sankar Datta

Une étude par simulation a été conçue en vue de répondre aux objectifs suivants :

Étudier les propriétés, en termes de biais et d’EQM, des estimateurs ETP quand $α$ varie pour une valeur fixe de $A,$ et quand $A$ varie pour une valeur fixe de $α .$ Nous souhaitons déterminer quelles valeurs de $α$ sont adéquates pour une valeur donnée de $A .$
Comparer les estimateurs ETP aux EBLUP basés sur le MVRE et aux EBLUP basés sur le MVA.
Étudier les propriétés des estimateurs proposés de l’EQM en ce qui concerne le biais relatif, ainsi que la couverture et la longueur des intervalles de prédiction.
Comparer les trois estimateurs pour petits domaines présentés qui attribuent un poids strictement positif à l’estimateur direct pour tous les domaines, à savoir l’EBLUP fondé sur les estimateurs MVA, TP-MVA et MVRE-MVA.

Pour réaliser les objectifs susmentionnés, nous avons généré des données à partir du modèle de Fay-Herriot donné par les équations (2.1) et (2.2) avec une moyenne constante, c’est-à-dire avec $p = 1, β = μ$ et $x_{i} = 1, i = 1, \dots, m .$ Nous posons que $μ = 0$ sans perte de généralité, que le nombre de domaines est $m = 15$ et que $D_{i} = 1, i = 1, \dots, m .$ L’étude par simulation a été répétée pour des valeurs croissantes de la variance du modèle, $A \in {0,01; 0,02; 0,05; 0,1; 0,2; 1},$ ainsi que pour six seuils de signification du test de $H_{0} : A = 0$ contre $H_{0} : A > 0,$ à savoir $α = {0,05; 0,1; 0,2; 0,3; 0,4; 0,5} .$ Pour chaque combinaison de $A$ et $α,$ nous avons procédé aux étapes qui suivent pour chaque exécution de la simulation $ℓ = 1, \dots, L$ avec $L = 10 000$ exécutions :

Générer les données au moyen du modèle hypothétique de moyenne nulle constante; c’est-à-dire

$\begin{array}{l} θ_{i}^{(ℓ)} & = & v_{i}^{(ℓ)}, v_{i}^{(ℓ)} \overset{ind}{\sim} N (0, A), \\ y_{i}^{(ℓ)} & = & θ_{i}^{(ℓ)} + e_{i}^{(ℓ)}, e_{i}^{(ℓ)} \overset{ind}{\sim} N (0, D_{i}), i = 1, \dots, m . \end{array}$
Calculer les estimateurs suivants de $θ :$ l’EBLUP basé sur l’estimation du MVRE de $A, {\hat{θ}}_{RE}^{(ℓ)},$ l’estimation ETP, ${\hat{θ}}_{TP}^{(ℓ)},$ l’EBLUP basé sur l’estimation du MVA de $A, {\hat{θ}}_{MVA}^{(ℓ)},$ l’estimation combinée TP-MVA ${\hat{θ}}_{TPMVA}^{(ℓ)}$ et l’estimation MVRE-MVA ${\hat{θ}}_{REMVA}^{(ℓ)} .$
Pour chaque domaine $i = 1, \dots, m,$ calculer : les trois estimations de l’EQM de l’EBLUP ${\hat{θ}}_{RE, i}$ données dans (3.2), (3.3) et (4.1), désignées respectivement par ${eqm}^{(ℓ)} ({\hat{θ}}_{RE, i}), {eqm}_{0}^{(ℓ)} ({\hat{θ}}_{RE, i})$ et ${eqm}_{TP}^{(ℓ)} ({\hat{θ}}_{RE, i}),$ et les trois estimations (6.3), (6.4) et (6.5) de l’EQM de l’estimateur combiné pour petits domaines ${\hat{θ}}_{REMVA, i},$ désignées ${eqm}^{(ℓ)} ({\hat{θ}}_{REMVA, i}), {eqm}_{0}^{(ℓ)} ({\hat{θ}}_{REMVA, i})$ et ${eqm}_{TP}^{(ℓ)} ({\hat{θ}}_{REMVA, i}),$ respectivement.
Pour chaque domaine $i = 1, \dots, m,$ obtenir les intervalles de prédiction $1 - α$ fondés sur l’hypothèse de normalité pour la moyenne de petit domaine $θ_{i}$ basée sur les trois estimateurs considérés de l’EQM de l’EBLUP :

$\begin{array}{l} {IC}_{i}^{(ℓ)} & = & {\hat{θ}}_{RE, i}^{(ℓ)} \mp Z_{α / 2} \sqrt{{eqm}^{(ℓ)} ({\hat{θ}}_{RE, i})}, \\ {IC}_{0, i}^{(ℓ)} & = & {\hat{θ}}_{RE, i}^{(ℓ)} \mp Z_{α / 2} \sqrt{{eqm}_{0}^{(ℓ)} ({\hat{θ}}_{RE, i})}, \\ {IC}_{TP, i}^{(ℓ)} & = & {\hat{θ}}_{RE, i}^{(ℓ)} \mp Z_{α / 2} \sqrt{{eqm}_{TP}^{(ℓ)} ({\hat{θ}}_{RE, i})}, \end{array}$

où $Z_{α / 2}$ est la valeur critique supérieure au seuil $α / 2$ d’une loi normale centrée réduite.
Répéter les étapes 1 à 4 pour $ℓ = 1, \dots, L,$ pour $L = 10 000 .$ Puis, pour chaque estimateur pour petits domaines ${\hat{θ}}_{i} \in {{\hat{θ}}_{RE, i}, {\hat{θ}}_{TP, i}, {\hat{θ}}_{MVA, i}, {\hat{θ}}_{TPMVA, i}, {\hat{θ}}_{REMVA, i}}, i = 1, \dots, m,$ calculer le biais et l’EQM empiriques sous la forme

$B ({\hat{θ}}_{i}) = \frac{1}{L} \sum_{ℓ = 1}^{L} ({\hat{θ}}_{i}^{(ℓ)} - θ_{i}^{(ℓ)}), EQM ({\hat{θ}}_{i}) = \frac{1}{L} \sum_{ℓ = 1}^{L} {({\hat{θ}}_{i}^{(ℓ)} - θ_{i}^{(ℓ)})}^{2} .$

Obtenir ensuite la moyenne sur les domaines des biais et des EQM absolus sous la forme

$\bar{BA} (\hat{θ}) = \frac{1}{m} \sum_{i = 1}^{m} | B ({\hat{θ}}_{i}) |, \bar{EQMA} (\hat{θ}) = \frac{1}{m} \sum_{i = 1}^{m} EQM ({\hat{θ}}_{i}) .$
Calculer le biais relatif de chaque estimateur de l’EQM, $eqm ({\hat{θ}}_{i}),$ comme il suit

$BR {eqm ({\hat{θ}}_{i})} = {\frac{1}{L} \sum_{ℓ = 1}^{L} {eqm}^{(ℓ)} ({\hat{θ}}_{i}) - EQM ({\hat{θ}}_{i})} / EQM ({\hat{θ}}_{i}) .$

Calculer la moyenne sur les domaines des biais relatifs absolus sous la forme

$\bar{BRA} {eqm (\hat{θ})} = \frac{1}{m} \sum_{i = 1}^{m} | BR {eqm ({\hat{θ}}_{i})} | .$
Pour chaque type d’intervalle de prédiction ${IC}_{i}^{(ℓ)} = (L_{i}^{(ℓ)}, U_{i}^{(ℓ)}),$ pour ${IC}_{i}^{(ℓ)} \in {{IC}_{i}^{(ℓ)}, {IC}_{0, i}^{(ℓ)}, {IC}_{TP, i}^{(ℓ)}}$ donné à l’étape 4, calculer le taux de couverture (TC) et la longueur moyenne (LM) empiriques comme il suit

${TC(IC}_{i}) = \frac{# {θ_{i}^{(ℓ)} \in {IC}_{i}^{(ℓ)}}}{L}, LM ({IC}_{i}) = \frac{1}{L} \sum_{ℓ = 1}^{L} (U_{i}^{(ℓ)} - L_{i}^{(ℓ)}) .$

Enfin, calculer la moyenne sur les domaines des taux de couverture et des longueurs moyennes, comme il suit

$\bar{TC} (IC) = \frac{1}{m} \sum_{i = 1}^{m} TC ({IC}_{i}), \bar{LM} (IC) = \frac{1}{m} \sum_{i = 1}^{m} LM ({IC}_{i}) .$

Les figures 7.1 et 7.2 représentent graphiquement les EQM moyennes des estimateurs ETP pour chaque valeur de $A \in {0,05; 0,1; 0,2},$ ainsi que l’EQM moyenne des EBLUP basés sur le MVRE et le MVA en fonction du seuil de signification $α .$ Notons que, quand la valeur de $A$ est petite, pour une grande valeur de $α,$ la procédure TP donne lieu plus souvent au rejet de $H_{0}$ et par conséquent l’estimateur ETP devient plus fréquemment l’EBLUP usuel, tandis que si la valeur de $α$ est faible, la procédure TP donne lieu moins fréquemment au rejet de $H_{0}$ et l’estimateur synthétique de type régression est alors utilisé plus souvent. Par contre, pour une grande valeur de $A,$ l’estimateur ETP devient plus fréquemment l’EBLUP quelle que soit la valeur de $α .$ Les biais absolus des estimateurs ne sont pas présentés ici, parce qu’ils sont à peu près les mêmes pour tous les estimateurs ETP pour les différentes valeurs de $α .$ Il en est ainsi parce que, quand le modèle est vérifié, les deux composantes de l’estimateur ETP, l’estimateur synthétique et l’EBLUP, sont sans biais pour le paramètre étudié. Notons que l’estimateur synthétique est sans biais même quand $A > 0.$ La première conclusion qui se dégage des figures 7.1 et 7.2 est que l’EQM de l’estimateur ETP est pratiquement constante pour les diverses valeurs de $α \geq 0,1 .$ Nous voyons aussi que l’EQM moyenne de l’estimateur ETP pour une valeur donnée de $α$ augmente avec $A,$ parce que l’estimateur ETP se réduit plus fréquemment à l’EBLUP quand $A$ augmente et que l’EQM de l’EBLUP augmente avec $A .$ Observons aussi que l’estimateur ETP et l’EBLUP basé sur le MVRE donnent des résultats très similaires pour $α \geq 0,2 .$ Cependant, pour $α < 0,2,$ l’estimateur ETP devient plus efficace que l’EBLUP aussitôt que $A$ s’approche de l’hypothèse nulle $(A < 0,1),$ ce qui concorde avec la remarque de Datta et coll. (2011).

Pour l’EBLUP basé sur le MVA, les figures 7.1 et 7.2 montrent que l’EQM moyenne est considérablement plus grande que celles des deux autres estimateurs, mais que les écarts par rapport aux autres diminuent à mesure que $A$ augmente. Cette situation est attribuable au biais de l’estimateur MVA de $A$ quand la valeur de $A$ est petite. Nous étudierons plus loin les estimateurs pour petits domaines combinés TP-MVA et MVRE-MVA, qui n’utilisent l’EBLUP basé sur le MVA que si l’hypothèse nulle n’est pas rejetée ou que l’estimation réalisée de $A$ est nulle.

Figure 7.1 EQM moyennes de l’ETP, de l’EBLUP basé sur le MVRE et de l’EBLUP basé sur le MVA en fonction de $α,$ pour a) $A = 0,05$ et b) $A = 0,1 .$

Description de la figure 7.1

Datta et coll. (2011, page 366) ont recommandé d’utiliser $α \geq 0,2$ pour l’ETP. En outre, selon la littérature sur l’estimation TP pour les modèles à effets fixes, un bon choix de $α$ en ce qui concerne le biais et l’EQM est $α = 0,2$ (Bancroft 1944; Han et Bancroft 1968). Cependant, les résultats susmentionnés donnent à penser que, pour $α \geq 0,2,$ l’estimateur ETP est pratiquement le même que l’EBLUP et qu’on pourrait par conséquent choisir de toujours utiliser l’EBLUP.

Figure 7.2 EQM moyennes de l’ETP, de l’EBLUP basé sur le MVRE et de l’EBLUP basé sur le MVA en fonction de $α,$ pour $A = 0,2 .$

Description de la figure 7.2

Nous allons maintenant étudier les propriétés de l’estimateur ETP pour l’estimation de l’EQM en fonction de $α .$ La figure 7.3 représente graphiquement le biais relatif absolu moyen des estimateurs de l’EQM ${eqm}_{TP} ({\hat{θ}}_{RE, i})$ étiqueté TP en fonction du seuil de signification $α$ pour chaque valeur $A \in {0,05; 0,1; 0,2; 1} .$ Lorsque l’on choisit $α$ très petit $α < 0,1,$ l’hypothèse nulle $H_{0} : A = 0$ est rejetée moins fréquemment et ${eqm}_{TP} ({\hat{θ}}_{RE, i})$ devient souvent égal à $g_{2 i},$ ce qui entraîne une sous-estimation. Pour une grande valeur de $α$ $(α > 0,2),$ l’hypothèse nulle est rejetée plus fréquemment et ${eqm}_{TP} ({\hat{θ}}_{RE, i})$ devient l’estimateur usuel de l’EQM de l’EBLUP, qui surestime fortement la valeur de l’EQM quand $A$ est petite. La valeur $α = 0,2$ semble être un bon compromis, avec un biais relatif absolu moyen de l’ordre de 10 % pour $A \geq 0,1$ et de 20 % pour $A = 0,05 .$

Figure 7.3 Moyenne sur les domaines des biais relatifs absolus de l’estimateur de l’EQM ${eqm}_{TP} ({\hat{θ}}_{RE, i}),$ étiqueté TP, pour $A \in {0,05; 0,1; 0,2; 1}$ en fonction du seuil de signification $α .$

Description de la figure 7.3

Les résultats susmentionnés donnent à penser que $α = 0,2$ est un bon choix lorsqu’on utilise la procédure TP pour estimer l’EQM de l’EBLUP usuel. Cette constatation a été étudiée de manière plus approfondie en examinant les biais relatifs (affectés d’un signe) de ${eqm}_{TP} ({\hat{θ}}_{RE, i})$ pour chaque domaine. Ces résultats sont représentés graphiquement aux figures 7.4 et 7.5, avec quatre graphiques, un pour chaque valeur de $A \in {0, 05; 0,1; 0,2; 1} .$ Les chiffres qui figurent dans les légendes de ces graphiques sont les seuils de signification $α$ pour l’estimateur ETP de l’EQM ${eqm}_{TP} ({\hat{θ}}_{RE, i}) .$ Ces graphiques confirment nos observations antérieures, à savoir que l’estimateur de l’EQM fondé sur l’ETP, ${eqm}_{TP} ({\hat{θ}}_{RE, i}),$ sous-estime $EQM ({\hat{θ}}_{RE, i})$ pour les faibles valeurs de $α$ et la surestime pour les grandes valeurs de $α .$ Il s’avère que ${eqm}_{TP} ({\hat{θ}}_{RE, i})$ avec $α = 0,2$ convient bien pour toutes les valeurs de $A .$

Figure 7.4 Biais relatif de ${eqm}_{TP} ({\hat{θ}}_{RE, i})$ pour chaque seuil de signification $α \in {0,05; 0,1; 0,2; 0,3; 0,4; 0,5}$ en fonction du domaine $i,$ pour a) $A = 0,05$ et b) $A = 0,1 .$

Description de la figure 7.4

Figure 7.5 Biais relatif de ${eqm}_{TP} ({\hat{θ}}_{RE, i})$ pour chaque seuil de signification $α \in {0,05; 0,1; 0,2; 0,3; 0,4; 0,5}$ en fonction du domaine $i,$ pour a) $A = 0,2$ et b) $A =1.$

Description de la figure 7.5

Comparons maintenant ${eqm}_{TP} ({\hat{θ}}_{RE, i})$ pour le seuil de signification choisi de $α = 0,2$ aux deux autres estimateurs de l’EQM, ${eqm}_{0} ({\hat{θ}}_{RE, i})$ et $eqm ({\hat{θ}}_{RE, i}),$ donnés par (3.3) et (3.2), respectivement. La figure 7.6 représente graphiquement les biais relatifs absolus moyens des trois estimateurs de l’EQM, étiquetés respectivement TP, MVRE0 et MVRE. Nous constatons que ${eqm}_{0} ({\hat{θ}}_{RE, i})$ donne de meilleurs résultats que $eqm ({\hat{θ}}_{RE, i})$ pour tous les domaines, mais que ${eqm}_{TP} ({\hat{θ}}_{RE, i})$ demeure meilleur que ${eqm}_{0} ({\hat{θ}}_{RE, i})$ pour toutes les valeurs considérées de $A$ sauf $A = 1,$ valeur pour laquelle les différences entre les trois estimateurs sont négligeables. Les écarts diminuent à mesure que $A$ augmente, mais soulignons que l’estimateur de l’EQM usuel, $eqm ({\hat{θ}}_{RE, i}),$ peut être sévèrement biaisé si la valeur de $A$ est petite, avec un biais relatif absolu moyen supérieur à 50 % pour $A < 0,2$ et croissant exponentiellement quand $A$ tend vers zéro. La conclusion est que, quand $H_{0}$ n’est pas rejetée, même si l’estimation réalisée de $A$ est positive, il semble préférable d’omettre le terme $g_{3 i}$ dans l’estimateur de l’EQM et de ne considérer que $g_{2 i} .$

Figure 7.6 Moyenne sur les domaines des biais relatifs absolus des estimateurs de l’EQM ${eqm}_{TP} ({\hat{θ}}_{RE, i})$ avec $α = 0,2,$ étiqueté TP, $eqm ({\hat{θ}}_{RE, i})$ étiqueté MVRE et ${eqm}_{0} ({\hat{θ}}_{RE, i})$ étiqueté MVRE0, en fonction de $A .$

Description de la figure 7.6

Examinons maintenant les estimateurs pour petits domaines qui appliquent un poids strictement positif à l’estimateur direct pour tous les domaines, à savoir l’EBLUP basé sur le MVA, ${\hat{θ}}_{MVA},$ et les deux estimateurs combinés, TP-MVA donné en (6.1) et MVRE-MVA donné en (6.2). Les EQM moyennes sont représentées graphiquement à la figure 7.7 pour ces trois estimateurs. Dans ce graphique, ${\hat{θ}}_{MVA}$ semble être un peu moins efficace, et est suivi par TP-MVA. L’estimateur combiné MVRE-MVA semble donner d’un peu meilleurs résultats que les deux autres pour une faible valeur de $A,$ quoique pour $A \geq 0,2,$ l’estimateur TP-MVA est très proche. Pour l’estimation de l’EQM, nous nous concentrons sur l’estimateur MVRE-MVA en raison de sa meilleure performance.

Figure 7.7 Moyenne sur les domaines des EQM pour l’estimateur TP-MVA avec $α = 0,2,$ l’EBLUP basé sur le MVA et l’estimateur MVRE-MVA en fonction de $A .$

Description de la figure 7.7

Pour l’estimateur combiné MVRE-MVA, la figure 7.8 montre que l’estimateur de l’EQM basé sur le test préliminaire TP, ${eqm}_{TP} ({\hat{θ}}_{REMVA, i})$ qui utilise seulement $g_{2 i}$ quand ${\hat{A}}_{RE} = 0$ ou que l’hypothèse nulle n’est pas rejetée, présente un biais relatif absolu moyen inférieur à 10 % pour $A \geq 0,1$ et est plus faible que les valeurs correspondantes pour $eqm ({\hat{θ}}_{REMVA, i})$ et ${eqm}_{0} ({\hat{θ}}_{REMVA, i}),$ spécialement pour $A \leq 0,4 .$

Figure 7.8 Moyenne sur les domaines des biais relatifs absolus des estimateurs de l’EQM $eqm ({\hat{θ}}_{REMVA, i}),$ ${eqm}_{0} ({\hat{θ}}_{REMVA, i})$ et ${eqm}_{TP} ({\hat{θ}}_{REMVA, i}),$ étiquetés respectivement MVRE-MVA, MVRE-MVA0 et TP, en fonction de $A .$

Description de la figure 7.8

Enfin, nous analysons la moyenne sur les domaines des taux de couverture et des longueurs moyennes des intervalles de prédiction fondés sur l’hypothèse de normalité pour la moyenne de petit domaine $θ_{i}$ en utilisant l’EBLUP basé sur le MVRE comme estimation ponctuelle et les trois estimateurs différents de l’EQM de l’EBLUP, à savoir $eqm ({\hat{θ}}_{RE, i}), {eqm}_{0} ({\hat{θ}}_{RE, i})$ et ${eqm}_{TP} ({\hat{θ}}_{RE, i}) .$ La figure 7.9 représente les taux de couverture des trois types d’intervalles, où les estimateurs de l’EQM basés sur la procédure TP ont été obtenus en prenant $α = 0,2; 0,3 .$ Il semble que les bonnes propriétés de biais relatif de l’estimateur de l’EQM basé sur la procédure TP, ${eqm}_{TP} ({\hat{θ}}_{RE, i}),$ pour une valeur faible de $A$ ne peuvent pas être extrapolées à la couverture basée sur les intervalles de prédiction normaux, et présentent une sous-couverture surtout pour $A = 0,2 .$ Dans ce cas, choisir un seuil de signification plus élevé, $α = 0,3,$ réduit un peu la couverture insuffisante des intervalles de prédiction obtenus en utilisant ${eqm}_{TP} ({\hat{θ}}_{RE, i}) .$ Néanmoins, les taux de couverture de ${eqm}_{0} ({\hat{θ}}_{RE, i})$ sont meilleurs pour toutes les valeurs de $A .$ Comme prévu, l’estimateur usuel de l’EQM $eqm ({\hat{θ}}_{RE, i})$ donne une surcouverture pour les petites valeurs de $A,$ laquelle résulte de la forte surestimation de l’EQM. Par ailleurs, les intervalles pour lesquels on observe une sous-couverture entraînent aussi des intervalles de prédiction plus courts, comme le montre la figure 7.10.

Il est utile de mentionner que la construction des intervalles de prédiction pour $θ_{i}$ basés sur le modèle de Fay-Herriot avec des taux de couverture exacts n’est pas une tâche évidente. Plusieurs articles traitant de ce problème ont été publiés. Par exemple, Chatterjee, Lahiri et Li (2008) ont proposé des intervalles de prédiction avec taux de couverture corrects jusqu’à l’ordre deux en utilisant uniquement le terme $g_{1 i}$ comme estimation de l’EQM et en appliquant une procédure bootstrap pour trouver les quantiles calés. Diao, Smith, Datta, Maiti et Opsomer (2014) ont obtenu récemment des intervalles de prédiction avec taux de couverture corrects jusqu’à l’ordre deux en évitant d’utiliser des procédures de rééchantillonnage et en utilisant l’estimateur complet de l’EQM. L’obtention d’intervalles de prédiction dont la couverture est exacte en utilisant d’autres estimations de l’EQM pose encore des difficultés et dépasse le cadre du présent article.

Figure 7.9 Moyenne sur les domaines des taux de couverture des intervalles de prédiction fondés sur la normalité pour $θ_{i}$ en utilisant les estimateurs de l’EQM $eqm ({\hat{θ}}_{RE, i}), {eqm}_{0} ({\hat{θ}}_{RE, i})$ et ${eqm}_{TP} ({\hat{θ}}_{RE, i})$ avec $α = 0,2; 0,3,$ étiquetés respectivement MVRE, MVRE0 et TP, en fonction de $A .$

Description de la figure 7.9

Figure 7.10 Moyenne sur les domaines des longueurs moyennes des intervalles basés sur l’hypothèse de normalité pour $θ_{i}$ en utilisant les estimateurs de l’EQM $eqm ({\hat{θ}}_{RE, i}), {eqm}_{0} ({\hat{θ}}_{RE, i})$ et ${eqm}_{TP} ({\hat{θ}}_{RE, i})$ avec $α = 0,2; 0,3,$ étiquetés respectivement MVRE, MVRE0 et TP, en fonction de $A .$

Description de la figure 7.10

L’étude par simulation dont la description précède a été répétée pour plusieurs profils de variances d’échantillonnage inégales $D_{i} .$ Les résultats ne sont pas présentés ici, mais les conclusions sont très semblables à condition que le profil de variance ne soit pas extrêmement irrégulier.

Précédent | Suivant

Date de modification :: 2015-11-27

Sélection de la langue

Recherche et menus

Recherche

Publications

Techniques d’enquête

Recherche par

7. Expériences de simulation