4 Log-vraisemblance composite pondérée : une approche unifiée
J.N.K. Rao, F. Verret et M.A. Hidiroglou
Précédent | Suivant
À
la présente section, nous proposons une approche unifiée applicable aux modèles
multiniveaux linéaires ainsi que linéaires généralisés. Cette approche est
fondée sur le concept de la vraisemblance composite qui a acquis de la
popularité dans la littérature ne portant pas sur les sondages pour traiter les
données en grappes ou les données spatiales (voir p. ex., Lindsay 1988,
Lele et Taper 2002 et Varin, Reid et Firth 2011). Une vraisemblance composite
marginale par paire s'obtient en multipliant les contributions à la
vraisemblance de toutes les paires distinctes dans les grappes. Notons que la
vraisemblance composite est obtenue en prétendant que les sous-modèles sont
indépendants. Lorsque le modèle de superpopulation est vérifié pour
l'échantillon, nous pouvons obtenir les estimateurs des paramètres en
maximisant la vraisemblance composite par paire. Ici, nous étendons cette
approche aux plans de sondage informatifs en obtenant des équations
d'estimation pondérées qui requièrent seulement les poids marginaux
et
et les poids par
paire
comme à la section 3.
La
log vraisemblance composite par paire de recensement est donnée par
où
est la densité
de probabilité conjointe marginale de
et
Nous estimons
(4.1) par la log-vraisemblance composite par paire pondérée par les poids de
sondage
qui dépend seulement des
probabilités d'inclusion de niveau 1 et de niveau 2 d'ordre 1 et
de probabilités d'inclusion de niveau 1 d'ordre 2. Puis, nous
résolvons les équations de score composite pondérées
provenant de (4.2) pour
obtenir un estimateur de la vraisemblance composite pondérée,
de
. La méthode proposée est applicable aux
modèles à deux niveaux linéaires et linéaires généralisés.
Nous
notons que
, donné par (4.3), est un vecteur de fonctions d'estimation
d'espérance nulle par rapport au plan et au modèle, c.-à-d.
En utilisant ce
résultat, on peut montrer que l'estimateur de la vraisemblance composite
pondérée (VCP)
de
est convergent
sous le modèle quand le nombre d'unités de niveau 2 dans l'échantillon,
augmente, même
si les tailles d'échantillon dans les grappes,
sont petites. La
preuve est exposée en détail dans Yi, Rao et Li (2012). Dans le contexte ne
faisant pas appel au sondage, les preuves théoriques et empiriques que
l'approche de la vraisemblance composite conduit à des estimateurs efficaces
sont limitées (p. ex., Bellio et Varin 2005, Lindsay et coll. 2011). Notre
étude en simulation (section 5) indique que l'approche de la vraisemblance
composite pondérée donne de bons résultats en ce qui concerne l'efficacité, même
si les tailles d'échantillon dans les grappes sont petites.
Dans
le cas du modèle à erreurs emboîtées (3.13), en nous inspirant de Lele et Taper
(2002), nous pouvons simplifier l'approche de la vraisemblance composite par
paire en remplaçant la densité de probabilité bivariée
par les densités
de probabilité univariées de
et la différence
Pour le modèle
de la moyenne (2.2), nous avons
et
. En reparamétrisant
de manière que
, où
nous voyons que
les paramètres des deux densités de probabilité univariées sont distincts et
que les log-vraisemblances composites correspondant à
et
sont données par
et
Nous résolvons alors le
système d'équations de score composite pondérées résultantes
pour obtenir les
estimateurs de la vraisemblance composite pondérée (VCP)
et
. Les estimateurs VCP sont identiques aux
estimateurs (3.9) à (3.11) obtenus par l'approche des équations d'estimation
pondérées de la section 3.
Nous
nous penchons maintenant sur le modèle de régression linéaire à erreurs
emboîtées (3.13). Mentionnons pour commencer que
, où
et
Il
s'ensuit que les équations de score composite pondérées sont données par
et
Les estimateurs VCP
résultants de
,
et
sont donnés par
et
L'estimateur de
est donné par
De nouveau, les
estimateurs VCP
,
et
sont identiques
aux estimateurs (3.17) à (3.19) obtenus par l'approche des équations d'estimation
pondérées de la section 3.
L'approche
de la vraisemblance composite susmentionnée, fondée sur
et
, n'est pas applicable au modèle à deux niveaux
linéaire donné par (2.4), parce que le vecteur de paramètres,
, n'est pas identifiable sous la vraisemblance
composite obtenue à partir des
et
. Nous devons faire appel à la méthode par
paire pour traiter le modèle (2.4).
Marginalement,
suit une loi
normale bivariée de moyennes
et
et de matrice de
covariance
Maintenant, il découle de (4.3) que
les équations de score composite pondérées sont données par
et
où
est la matrice
de dimensions
contenant les
lignes
et
,
, et
est le vecteur
de dimension P contenant les éléments
et les
éléments distincts
de
désignés
par
. Nous pouvons résoudre les équations de score
composite pondérées (4.4) et (4.5) itérativement en utilisant la méthode de
Newton-Raphson ou une autre méthode itérative pour obtenir les estimateurs VCP
et
.
Dans le cas
particulier du modèle de régression linéaire à erreurs emboîtées (3.13), les
équations de score de recensement, fondées sur la log-vraisemblance de
recensement complète
donnée par
(2.5), peuvent s'écrire sous une forme explicite. Les équations de score
pondérées d'échantillon correspondantes ne dépendent que des poids de
niveau 1
et
et des poids de
niveau 2
comme les
équations de score composite pondérées (voir l'annexe). Les estimateurs
résultants sont convergents sous le modèle pour
, contrairement aux estimateurs fondés sur la
pseudo log-vraisemblance pondérée
donnés par (2.7)
et (2.8). Cependant, pour des modèles plus complexes, comme les modèles à deux
niveaux avec pentes aléatoires, les équations de score pondérées d'échantillon dépendront
des probabilités d'inclusion de niveau 1 d'ordres 3 et 4,
contrairement aux équations de score composite pondérées (4.3) qui ne dépendent
que des probabilités d'inclusion de niveau 1 d'ordres 1 et 2, même
pour les modèles multiniveaux complexes. Par conséquent, nous n'avons pas
inclus l'approche des équations de score pondérées fondée sur la log-vraisemblance
de recensement complète dans l'étude en simulation.
Précédent | Suivant