2 Estimation bayésienne linéaire en population finie
Kelly Cristina M. Gonçalves, Fernando A. S. Moura et Helio S. Migon
Précédent | Suivant
L'approche bayésienne s'est avérée
fructueuse dans de nombreuses applications, particulièrement lorsque l'analyse
des données a été améliorée par des jugements d'expert. Cependant, si les modèles
bayésiens possèdent de nombreuses caractéristiques intéressantes, leur
application requiert souvent la spécification complète d'une loi a priori,
ou prior, pour un grand nombre de paramètres. Goldstein et Wooff (2007),
section 1.2, soutiennent que, à mesure que le problème se complexifie, notre
aptitude réelle à spécifier complètement la loi a priori et/ou le modèle
d'échantillonnage en détail diminue. Ils concluent que, dans de telles
situations, il est nécessaire d'élaborer des méthodes qui reposent sur une
spécification faisant appel à la croyance partielle.
Hartigan (1969) a proposé une méthode
d'estimation, qu'il a nommée approche d'estimation bayésienne linéaire, qui ne
nécessite que la spécification des premier et deuxième moments. Les estimateurs
résultants ont la propriété de minimiser la perte quadratique a posteriori
parmi tous les estimateurs qui sont linéaires en les données et peuvent être
considérés comme des approximations des moyennes a posteriori. L'approche d'estimation
bayésienne linéaire, qui est employée pleinement dans le présent article, est
décrite brièvement ci-dessous.
2.1 Approche bayésienne linéaire
Soit le vecteur des observations et le paramètre à estimer. Pour chaque valeur de et chaque estimation possible appartenant à l'espace paramétrique nous associons une fonction de perte
quadratique Nous souhaitons avant tout trouver la valeur
de qui minimise la valeur prévue conditionnelle de la fonction
de perte quadratique fournie par les données.
Supposons que la distribution conjointe
de et est spécifiée partiellement par leurs deux
premiers moments seulement :
où et respectivement, désignent les vecteurs des
moyennes et et les éléments de la matrice de covariance de et
L'estimateur bayésien linéaire (EBL) de
est la valeur de qui minimise la valeur prévue de cette
fonction de perte quadratique dans la classe de toutes les estimations
linéaires de la forme pour un vecteur et une matrice Donc, l'EBL de et sa variance associée, sont donnés respectivement
par
Il convient de souligner que l'EBL
dépend de la spécification des premier et deuxième moments de la distribution
conjointe partiellement spécifiée en (2.1). Le problème de l'obtention de ces
quantités est traité aux sections 2.3.1 et 4.1 pour certains cas
particuliers.
2.2 Approche bayésienne linéaire en population
finie
Considérons une population finie comprenant unités. Soit le vecteur des valeurs d'intérêt des unités
dans Le vecteur de réponses est divisé en le vecteur des valeurs connues
observées sur l'échantillon de taille et en le vecteur des valeurs non observées de dimension Le problème général consiste à prédire une
fonction du vecteur telle que le total où et sont les vecteurs de 1 de dimensions et respectivement. Dans l'approche fondée sur un
modèle, cela se fait habituellement en se servant d'un modèle paramétrique
hypothétique pour les valeurs de population puis en obtenant le meilleur prédicteur
linéaire sans biais empirique (EBLUP) pour le vecteur inconnu sous ce modèle. Habituellement, l'erreur quadratique
moyenne de l'EBLUP de s'obtient par approximation d'ordre deux, de
même qu'un estimateur sans biais. Voir Valliant, Dorfman et Royall (2000),
chapitre 2, pour des renseignements détaillés.
L'approche bayésienne de la prédiction en
population finie repose souvent sur l'hypothèse d'un modèle paramétrique, mais
elle vise à trouver la loi a posteriori de sachant On peut obtenir les estimations ponctuelles en
spécifiant une fonction de perte, quoique dans de nombreux problèmes pratiques,
on considère souvent la moyenne a posteriori dont la variance associée est
donnée par la variance a posteriori, c'est-à-dire :
Il est possible d'obtenir une
approximation des quantités dans (2.3) en utilisant une approche d'estimation
bayésienne linéaire. Ici, nous obtiendrons en particulier les estimateurs en
émettant l'hypothèse d'un modèle hiérarchique à deux degrés général en
population finie, spécifié uniquement par sa moyenne et sa matrice de
variance-covariance, présenté dans Bolfarine et Zacks (1992), page 76. Les
cas particuliers décrivant les structures de population habituellement
observées en pratique peuvent être dérivés facilement de (2.4). Le modèle
général peut s'écrire :
où est une matrice de covariables de dimensions avec les lignes est un vecteur de dimension de paramètres inconnus, et sachant est un vecteur aléatoire de moyenne et de matrice de covariance connue de dimensions De manière analogue, et sont, respectivement, le vecteur des moyennes
a priori de dimension et la matrice de covariance a priori de
dimensions de
Puisque le vecteur de réponses est divisé en et la matrice qui est supposée connue, est divisée de
manière analogue en et et est divisée en et L'objectif premier est de prédire sachant l'échantillon observé puis le total Voici les étapes que nous avons suivies :
premièrement, nous avons utilisé une loi a priori conjointe qui n'est
spécifiée que partiellement en ce qui concerne les moments comme il suit :
Donc, en appliquant le résultat
général dans l'équation (2.2), l'EBL de et la perte quadratique prévue minimale
(variance associée) sont donnés par :
Remarque 1 : Il convient de souligner que, sous l'hypothèse de normalité, et
sont données, respectivement, par les
membres de droite des équations de (2.5). L'EBL et sa variance associée donnés en (2.5)
peuvent être considérés respectivement, comme des approximations de
et pour les cas de non-normalité.
Maintenant, si nous revenons au modèle
(2.4), nous devons adapter la structure (2.1) et utiliser les résultats de
(2.2) pour obtenir l'EBL de et sa variance associée, donnés respectivement par :
Il est facile de voir que, dans (2.6),
la première équation peut être réécrite sous la forme où Il convient de souligner que, si nous plaçons
une loi a priori vague sur en prenant nous obtenons l'estimateur par les moindres
carrés minimal de
Maintenant, en appliquant les
propriétés bien connues des espérances et des variances conditionnelles, nous
obtenons :
En remplaçant et dans (2.7) par leur EBL respectif donné en
(2.5) et puis, en remplaçant et par et
donnés en (2.6), nous obtenons l'EBL de
et sa variance associée sous la forme :
Remarque 2 : De manière analogue à la remarque 1, sous l'hypothèse de
normalité, nous avons que les membres de droite des équations (2.8) sont,
respectivement, les valeurs de
et
L'expression générale de l'EBL du total
et de sa variance associée est obtenue en
remplaçant et dans les équations (2.3) par leurs équivalents respectifs et
Il convient de souligner que, dans de
nombreuses applications de (2.9), la matrice est supposée être diagonale, ce qui implique
que et nous avons alors :
En guise d'illustration, nous
considérons certains exemples discutés par O'Hagan (1985) et proposons un
nouvel estimateur par le ratio, qui est l'une des contributions des présents
travaux. Tous les exemples peuvent être traités comme des cas particuliers du
modèle (2.4).
2.3 Retour sur certains plans de sondage fréquents
2.3.1 Échantillonnage aléatoire simple sans
remise : échangeabilité
O'Hagan (1985) a examiné le cas simple
où la population ne présente aucune structure pertinente, ce qui peut se faire
en spécifiant :
Remarque 3 : On peut justifier la corrélation
introduite dans le modèle (2.11) en invoquant l'imitation de l'échantillonnage
aléatoire simple sans remise.
En appliquant le résultat général
établi dans (2.10) à (2.11) avec de dimension 1, et où nous obtenons l'EBL de et sa variance associée :
où
Il convient de souligner que est une moyenne pondérée de la moyenne
a priori et de la moyenne d'échantillon où est le ratio entre les deux quantités de
population. La moyenne peut être considérée comme le prior du
chercheur pour la moyenne de population réelle L'incertitude au sujet de est divisée en deux composantes :
l'incertitude au sujet du niveau global des (inter-variation) et l'incertitude quant à la
part de chaque qui peut différer de ce niveau global
(intra-variation). Une mesure utile de la variabilité des unités dans la
population est donnée par
Il n'est pas difficile de montrer que
Par conséquent, peut être interprétée comme une estimation
a priori de la variabilité à l'intérieur de la population. Nous obtenons
aussi Dans de nombreuses applications, est grand et la constante peut donc être considérée
comme l'inter-variation.
En posant que et en maintenant fixe, c'est-à-dire en supposant que l'on ne connaît
pas les priors, les estimations dans (2.12) donnent :
Ces expressions sont fort semblables
à l'estimation bien connue du total et à sa variance dans le contexte fondé sur
le plan de sondage pour le cas de l'échantillonnage aléatoire simple. O'Hagan (1985)
a discuté de certains moyens possibles d'éviter la tâche difficile d'attribuer
une valeur à Le moyen le plus naturel de le faire consiste
à trouver son EBL, mais linéaire en les carrés et les termes de variance des
produits croisés. Cependant, il est nécessaire de spécifier les moments d'ordre
quatre des Goldstein (1979) a proposé un EBL de la
variance qui n'utilise que des fonctions linéaires des données. Néanmoins, on
obtient une expression compliquée de la variance associée de son EBL modifié. O'Hagan
(1985) a soutenu que, si l'information a priori au sujet des composantes
de la variance est faible, toute estimation a posteriori s'approche des
estimations non bayésiennes classiques obtenues en utilisant uniquement les
données, lorsque ce gendre d'estimations est disponible. Par conséquent, il a
proposé, en guise de procédure bayésienne approximative, d'introduire ces
estimations de variance classiques par substitution dans l'EBL et dans sa
variance associée lorsque cela est approprié. Dans le cas qui nous occupe, nous
pouvons remplacer par qui est sans biais sous le plan pour
2.3.2 Échantillonnage aléatoire simple stratifié sans
remise
Soit la unité, appartenant à la strate Nous supposons que la taille de strate, est connue pour toutes les strates.
L'échangeabilité d'ordre deux dans chaque strate est énoncée dans O'Hagan (1985)
sous la forme :
Remarque 4 : Il est raisonnable de supposer que l'information obtenue au sujet
d'une strate pourrait modifier les croyances au sujet des autres strates dans
certaines applications spéciales. Cependant, si nous voulons imiter
l'échantillonnage aléatoire simple stratifié, nous devons supposer que les
observations dans les diverses strates ne sont pas corrélées, en posant que
Le modèle général (2.4) peut être
appliqué à ce cas en prenant et avec et où est une matrice de dimensions avec si et autrement. L'EBL de et sa variance associée sont obtenus au moyen
de (2.10) et figurent dans O'Hagan (1985). Les modèles pour l'échantillonnage
en grappes sont donnés dans Bolfarine et Zacks (1992), page 11. L'EBL des
modèles avec grappes figurent dans O'Hagan (1985).
Précédent | Suivant