Inférence bayésienne pour un modèle des composantes de la variance fondée sur la vraisemblance composite par paire à partir des données d’enquête
Section 3. Études par simulations
3.1 Plan de simulation
Au
moyen d’études par simulations, nous avons évalué le rendement de la méthode
proposée, c’est-à-dire la vraisemblance composite par paire avec un ajustement
de la courbure, et nous l’avons comparé à celui de la vraisemblance complète et
de la vraisemblance composite par paire. Nous avons utilisé le modèle de
l’équation (1.1) pour générer nos données, c’est-à-dire que pour et nous avons simulé les valeurs de à partir de
où et Cela équivaut à avoir appliqué la génération
de la superpopulation et l’échantillonnage décrits au paragraphe se rapportant
à l’équation (1.1).
Notre
première étude, qui ne fait pas l’objet du présent article, s’est penchée sur
l’inférence au sujet de avec connue et Elle a démontré que l’utilisation de la
vraisemblance composite par paire pour l’inférence au sujet de surestimait grandement la précision et que
l’ajustement de la courbure était efficace. Nous avons donc procédé à une étude
plus approfondie visant à examiner l’inférence à la fois pour et Par souci de simplicité, nous avons pris et avons considéré et . Pour la loi a priori
demi-Cauchy définie dans l’équation (2.4), nous avons pris Il y avait 500 ensembles de données qui se
répliquaient pour chaque paramètre.
Nous
avons examiné trois scénarios : 1) et la loi a priori demi-Cauchy sur
2) rapport signal-bruit, et la loi a priori demi-Cauchy sur
où le et 3) et une loi a priori uniforme Pour l’ensemble des scénarios, nous avons
utilisé une loi a priori uniforme pour
À la
section 3.2, nous décrivons les algorithmes utilisés dans les études par
simulations.
3.2 Algorithmes
Comme
nous l’avons fait aux sections 2.1 et 2.2, définissons avec et De plus, désigne la valeur de à la itération où La vraisemblance complète est
comme dans l’équation (2.7).
L’utilisation de l’équation (3.2) de
même que de la loi a priori, permet d’obtenir la densité a posteriori,
L’échantillonnage de et de est réalisé en deux étapes :
- Étape 1. Échantillonner à partir de où
Nous établissons la valeur de départ,
comme l’estimation du maximum de vraisemblance
de
- Étape 2. Utiliser l’algorithme de Metropolis-Hastings
(MH) pour tirer à partir de Cette dernière valeur est facilement obtenue à
partir de Soit le candidat désigné est tiré de la distribution des sauts, Si Sinon, la procédure est normale et comporte un
rapport d’acceptation-rejet où et
- Étape 3. Répéter les étapes 1 et 2 pour fois avec les 200 premiers échantillons utilisés comme rodage.
La
vraisemblance composite par paire (VP) est
comme dans l’équation (2.8).
L’utilisation
de l’équation (3.3) de même que de la loi a priori choisie, permet d’obtenir la densité a posteriori
L’échantillonnage
de et de est réalisé en trois étapes :
- Étape 1. Échantillonner à partir de où
- Étape 2. Utiliser l’algorithme de Metropolis-Hastings
(MH) pour tirer à partir de tel qu’il est décrit à l’étape 2
ci-dessus pour la VC (en remplaçant la VP par la VC dans toutes les formules).
- Étape 3. Répéter les étapes 1 et 2 pour fois avec les 200 premiers échantillons utilisés comme rodage.
La dernière étape consiste à obtenir
la vraisemblance composite par paire ajustée (VPA) (courbure), tel qu’elle est
décrit à la section 2.3. Cette dérivation, fondée sur l’approche de
Ribatet, Cooley et Davison, exploite les moyennes a posteriori estimées
de et de
- Étape 1. Soit tirer le candidat à partir de la distribution des sauts normale
à deux variables, où Si Sinon, passer à l’étape 2.
- Étape 2. Définissons comme le logarithme du rapport de
vraisemblance composite par paire obtenu en prenant le logarithme de l’équation
(3.3) et comme le logarithme du rapport de
vraisemblance composite par paire correspondant aux données de la grappe c’est-à-dire
- Étape 3.
Obtenir numériquement et
où et sont les moyennes a posteriori
estimées et
- Étape 4. D’après l’approche de Ribatet, Cooley et
Davison, et au moyen de la décomposition en valeurs singulières, nous écrivons et pour certaines matrices et Définir ensuite Dans notre cas, est une matrice
- Étape 5. Selon l’approche de Ribatet, Cooley et Davison,
le logarithme du rapport de vraisemblance composite par paire ajusté, est
où
- Étape 6. Définir la densité a posteriori
par paire ajustée comme
où ce dernier étant défini à l’étape 5.
À l’aide de la valeur candidate, obtenue à l’étape 1, définir la valeur
candidate ajustée Le rapport d’acceptation-rejet est alors
Les autres étapes sont les étapes
normales pour l’algorithme de Metropolis-Hastings.
3.3 Résultats des simulations
Pour
chaque méthode (VC, VP, VPA), chaque paramètre du plan et chaque loi a priori, nous
résumons les résultats des simulations en utilisant a) les taux de couverture
des intervalles de crédibilité sous échantillonnage répété et b) les moyennes
des points 0,025; 0,25; 0,50; 0,75 et 0,975 des lois a posteriori
de et de
Des
résumés graphiques sont également présentés, c’est-à-dire des estimations de la
densité a posteriori moyenne
pour chacune des lois a posteriori, c’est-à-dire et D’abord, considérons un intervalle, disons, qui soutient la plus grande partie de la masse
(par exemple 95 %) des densités a posteriori. Divisons-le
ensuite en sous-intervalles échelonnés également
comportant les points de découpage Pour soit l’estimation de la densité a posteriori
dérivée de la simulation où désigne la VC, la VP ou la VPA et correspond au nombre de simulations. Définissons
ensuite, pour
Prenons
ensuite une courbe reliant les points pour comme estimation
de la densité a posteriori moyenne pour
Le
tableau 3.1 présente les taux de couverture pour et pour et La figure 3.1 présente les estimations
moyennes de la densité a posteriori pour et pour et Au tableau 3.1 et à la figure 3.1,
les résumés sont présentés pour la vraisemblance complète (VC), la
vraisemblance composite par paire (VP) et la vraisemblance composite par paire
ajustée (VPA).
Tableau 3.1
Taux de couverture (en pourcentage) pour les 95 % des intervalles de crédibilité de
et
avec
Sommaire du tableau
Le tableau montre les résultats de Taux de couverture (en pourcentage) pour les 95 % des intervalles de crédibilité de
et
avec
0,1,
0,289,
0,5,
0,866,
et
, calculées selon
unités de mesure (figurant comme en-tête de colonne).
|
0,1 |
0,289 |
0,5 |
0,866 |
|
|
|
|
|
|
|
|
|
|
|
97,40 |
95,80 |
94,84 |
94,60 |
94,80 |
94,40 |
94,80 |
95,00 |
|
68,20 |
66,60 |
58,45 |
58,40 |
53,60 |
51,40 |
50,00 |
50,20 |
|
92,40 |
93,00 |
92,96 |
93,60 |
92,20 |
92,20 |
91,60 |
93,00 |
|
|
94,80 |
95,00 |
95,00 |
94,00 |
94,80 |
94,20 |
95,00 |
93,80 |
|
43,80 |
42,80 |
35,40 |
31,80 |
30,40 |
29,60 |
27,40 |
26,40 |
|
90,60 |
91,80 |
92,20 |
93,40 |
92,80 |
92,60 |
91,80 |
93,00 |
|
|
97,20 |
99,00 |
91,55 |
95,40 |
93,00 |
94,80 |
92,60 |
95,00 |
|
92,80 |
85,60 |
59,62 |
61,80 |
52,40 |
54,20 |
46,20 |
48,20 |
|
88,40 |
83,40 |
86,85 |
92,20 |
84,40 |
91,20 |
82,00 |
89,60 |
|
|
99,00 |
97,20 |
93,60 |
92,80 |
93,80 |
93,80 |
93,00 |
93,60 |
|
63,60 |
56,80 |
33,40 |
38,00 |
27,00 |
29,60 |
24,40 |
26,60 |
|
82,80 |
84,40 |
85,20 |
89,00 |
80,80 |
86,60 |
79,00 |
87,00 |
Le
résumé suivant présente les résultats pour la loi a priori
demi-Cauchy seulement avec et les deuxième et quatrième valeurs
correspondant au RSB = 0,25 et au RSB = 0,75,
respectivement. Les résultats sont semblables pour les trois choix de et pour la loi a priori uniforme.
Sans
ajustement, les couvertures de la VP sont considérablement différentes du
niveau nominal de 0,95. Par exemple (tableau 3.1), pour et la couverture pour est inférieure à 0,30. Si nous considérons toutes les valeurs des paramètres du
plan, la plus grande couverture est de 0,70. Dans la plupart des cas, la
couverture pour est bien inférieure à 0,70.
Lorsque
l’ajustement de la courbure est pris en compte, la couverture pour est excellente. Des 48 cas (trois choix
de deux choix de deux choix de quatre choix de treize avaient une couverture entre 0,93 et
0,95, vingt-deux entre 0,92 et 0,93, onze entre 0,91 et 0,92, et deux de moins
de 0,91, avec le dernier cas de figure pour et et 15.
Lorsque
l’ajustement de la courbure est pris en compte, la couverture pour varie considérablement, mais il y a, dans la
plupart des cas, une très grande amélioration de la couverture comparativement
à l’utilisation de la vraisemblance composite par paire non ajustée.
Les
tracés (figure 3.1) montrent que, pour la loi a posteriori correspondant
à la vraisemblance ajustée se rapproche beaucoup de la loi a posteriori
fondée sur la vraisemblance complète. Pour il existe des différences entre les lois a posteriori
correspondant à la vraisemblance complète et à la vraisemblance ajustée, en
particulier une transition vers des valeurs plus faibles dans le cas de cette
dernière.
Pour
étudier les effets de l’augmentation de et de considérons la différence où désigne la couverture et VC et VPA renvoient
aux lois a posteriori correspondantes.
Dans
l’ensemble, lorsque nous considérons tous les et pour diminue à mesure que augmente. Pour les valeurs plus grandes de diminue à mesure que augmente, tandis que pour les valeurs plus
faibles de a tendance à augmenter à mesure que augmente. Dans l’ensemble, pour diminue à mesure que augmente, sauf dans le cas où tandis que augmente à mesure que augmente.
La
raison de la détérioration de l’ajustement à mesure que augmente pourrait être que le nombre de paires
par grappe est et augmente plus rapidement, de sorte que la
vraisemblance par paire se concentre plus rapidement autour de son mode;
l’ajustement de la courbure peut ne pas être suffisant pour compenser un
changement de forme du logarithme du rapport de vraisemblance composite par
paire, par exemple une augmentation de l’aplatissement.
Le
tableau 3.2 présente les taux de non-couverture unilatéraux pour les
95 % des intervalles de crédibilité pour et au moyen de et Nous observons ce qui suit :
- Pour la non-couverture pour les intervalles de
vraisemblance complète semble symétrique. La vraisemblance par paire ajustée
présente un sous-dénombrement pour et, sauf lorsque est égale à 0,1, le sous-dénombrement est
symétrique. Nous observons seulement une dépendance de la couverture sur dans le cas où
- Pour l’intervalle de vraisemblance complète
présente un sous-dénombrement qui se rapproche du niveau nominal et n’est pas
très asymétrique, sauf dans le cas où pour lequel nous observons un sous-dénombrement
marqué. Pour et la couverture s’améliore à mesure que passe de 20 à 40, mais pour et la couverture présente peu de différence pour
les deux valeurs de
- Pour la vraisemblance par paire ajustée présente
une couverture asymétrique. Sauf dans le cas où l’ampleur de la non-couverture à gauche a
tendance à être semblable à celle de la vraisemblance complète, mais beaucoup
plus grande à droite, et la couverture s’améliore à mesure que passe de 20 à 40.

Description de la figure 3.1
Figure représentant les densités a posteriori moyennes estimées de
(graphiques a et b) et de (graphiques c et d) au moyen de trois méthodes (la méthode fondée sur la vraisemblance complète (en noir), composite (en rouge) et ajustée (en bleu)) lorsque l’hyperparamètre d’échelle
le nombre de grappes
la taille de grappe
et
utilisant une loi a priori demi-Cauchy pour
Les tracés montrent que, pour
la loi a posteriori correspondant à la vraisemblance ajustée se rapproche beaucoup de la loi a posteriori fondée sur la vraisemblance complète. Pour
il existe des différences entre les lois a posteriori correspondant à la vraisemblance complète et à la vraisemblance ajustée, en particulier une transition vers des valeurs plus faibles dans le cas de cette dernière.
Sachant que le logarithme du rapport
de vraisemblance par paire ajusté n’est pas explicitement construit pour
estimer le logarithme du rapport de vraisemblance complet, nous constatons que,
dans la figure 3.1, le logarithme du rapport de vraisemblance par paire
ajusté diminue plus rapidement dans les queues.
Nous avons également tenté de
centrer l’ajustement de la courbure sur le mode a posteriori du
logarithme du rapport de vraisemblance par paire plutôt que sur la moyenne a posteriori
du logarithme du rapport de vraisemblance par paire, et nous avons constaté que
le sous-dénombrement augmentait, même si l’asymétrie de la couverture était
moins marquée, pour les intervalles de crédibilité qui en découlent.
Tableau 3.2
Taux de non-couverture unilatéraux (en pourcentage) pour les 95 % des intervalles de crédibilité (IC) de
et
avec
Sommaire du tableau
Le tableau montre les résultats de Taux de non-couverture unilatéraux (en pourcentage) pour les 95 % des intervalles de crédibilité (IC) de
et
avec
TNC-G, TNC-D,
0,1,
0,289,
et
, calculées selon
unités de mesure et
(figurant comme en-tête de colonne).
|
TNC-G |
TNC-D |
TNC-G |
TNC-D |
TNC-G |
TNC-D |
TNC-G |
TNC-D |
0,1 |
0,289 |
|
|
|
|
|
|
|
1,40 |
1,20 |
1,60 |
2,60 |
3,05 |
2,11 |
3,20 |
2,20 |
|
16,60 |
15,20 |
16,40 |
17,00 |
21,13 |
20,42 |
20,40 |
21,20 |
|
2,60 |
5,00 |
2,20 |
4,80 |
3,76 |
3,29 |
3,80 |
2,60 |
|
|
2,80 |
2,40 |
2,40 |
2,60 |
3,00 |
2,00 |
3,20 |
2,80 |
|
26,80 |
29,40 |
28,60 |
28,60 |
33,00 |
31,60 |
33,80 |
34,40 |
|
3,60 |
5,80 |
4,60 |
3,60 |
4,00 |
3,80 |
3,80 |
2,80 |
|
|
|
|
2,80 |
0,00 |
1,00 |
0,00 |
3,05 |
5,40 |
1,80 |
2,80 |
|
7,20 |
0,00 |
9,20 |
5,20 |
14,79 |
25,59 |
14,80 |
23,40 |
|
4,60 |
7,00 |
3,60 |
13,00 |
3,05 |
10,09 |
2,40 |
5,40 |
|
|
1,00 |
0,00 |
2,00 |
0,80 |
3,00 |
3,40 |
3,80 |
3,40 |
|
14,60 |
21,80 |
17,80 |
25,40 |
22,80 |
43,80 |
24,80 |
37,20 |
|
3,40 |
13,80 |
3,80 |
11,80 |
3,00 |
11,80 |
2,80 |
8,20 |
|
0,5 |
0,866 |
|
|
|
|
|
|
|
3,20 |
2,00 |
3,00 |
2,60 |
3,40 |
1,80 |
3,00 |
2,00 |
|
24,40 |
22,00 |
24,60 |
24,00 |
26,40 |
23,60 |
25,80 |
24,00 |
|
4,40 |
3,40 |
4,20 |
3,60 |
4,20 |
4,20 |
3,80 |
3,20 |
|
|
3,00 |
2,20 |
3,40 |
2,40 |
3,00 |
2,00 |
3,40 |
2,80 |
|
34,60 |
35,00 |
35,60 |
34,80 |
36,80 |
35,80 |
37,60 |
36,00 |
|
4,00 |
3,20 |
4,20 |
3,20 |
4,80 |
3,40 |
3,40 |
3,60 |
|
|
|
|
3,00 |
4,00 |
2,20 |
3,00 |
3,40 |
4,00 |
2,00 |
3,00 |
|
16,00 |
31,60 |
18,20 |
27,60 |
19,20 |
34,60 |
21,00 |
30,80 |
|
1,20 |
14,40 |
1,80 |
7,00 |
1,40 |
16,60 |
2,20 |
8,20 |
|
|
3,20 |
3,00 |
2,80 |
3,40 |
3,80 |
3,20 |
3,20 |
3,20 |
|
24,00 |
49,00 |
28,00 |
42,40 |
25,40 |
50,20 |
29,80 |
43,60 |
|
2,60 |
16,60 |
2,40 |
11,00 |
3,20 |
17,80 |
2,00 |
11,00 |