Inférence bayésienne pour un modèle des composantes de la variance fondée sur la vraisemblance composite par paire à partir des données d’enquête
Section 5. Conclusion

Il existe des raisons philosophiques et théoriques bien connues d’envisager des approches bayésiennes pour réaliser un échantillonnage, et des travaux de recherche dans ce domaine sont réalisés depuis longtemps. Voir, par exemple, Sedransk (2008). Il existe aussi des avantages pratiques. L’utilisation d’une approche bayésienne plutôt qu’une approche fréquentiste s’appuie beaucoup moins sur des approximations, en remplaçant des calculs par des expressions asymptotiques. Dans le contexte des modèles à effets aléatoires, un avantage important est la capacité de contraindre les composantes de la variance à des valeurs non négatives dans la loi a priori, sans masquer les lacunes des données.

Le Service national de la statistique agricole (NASS) du ministère américain de l’Agriculture est l’un des endroits où des méthodes bayésiennes sont largement utilisées. Au NASS, on emploie des méthodes bayésiennes pour produire des statistiques officielles à l’échelle du pays et des États pour des variables comme la superficie des cultures et le rendement des cultures. Souvent, ces inférences reposent sur plusieurs sources de données. On accorde une attention particulière à l’estimation cohérente dans l’ensemble de la hiérarchie des régions géographiques d’intérêt aux fins de l’inférence. Voir Nandram, Berg et Barboza (2014); Erciulescu, Cruze et Nandram (2020, 2019, 2018); et Cruze, Erciulescu, Nandram, Barboza et Young (2019) pour obtenir de plus amples précisions.

Nous nous sommes penchés sur une utilisation de la vraisemblance composite par paire dans l’inférence bayésienne pour les données d’enquête, c’est-à-dire que nous avons élaboré une loi a posteriori pour la moyenne θ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfea0=yr0R Yxir=Jbba9q8aq0=yq=He9q8qqQ8frFve9Fve9Ff0dmeaabaqaciGa caGaaeqabaGaaiaadaaakeaacqaH4oqCaaa@3363@  et le paramètre d’écart-type σ u MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfea0=yr0R Yxir=Jbba9q8aq0=yq=He9q8qqQ8frFve9Fve9Ff0dmeaabaqaciGa caGaaeqabaGaaiaadaaakeaacqaHdpWCdaWgaaWcbaGaamyDaaqaba aaaa@3496@  d’un modèle à effets aléatoires simple. Nous avons évalué la loi a posteriori en ce qui a trait aux propriétés de couverture fréquentistes des intervalles de crédibilité pour les paramètres et constaté qu’elle fonctionne bien pour θ, MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfea0=yr0R Yxir=Jbba9q8aq0=yq=He9q8qqQ8frFve9Fve9Ff0dmeaabaqaciGa caGaaeqabaGaaiaadaaakeaacqaH4oqCcaGGSaaaaa@3413@  mais qu’elle n’est pas pleinement satisfaisante pour l’inférence au sujet de σ u MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfea0=yr0R Yxir=Jbba9q8aq0=yq=He9q8qqQ8frFve9Fve9Ff0dmeaabaqaciGa caGaaeqabaGaaiaadaaakeaacqaHdpWCdaWgaaWcbaGaamyDaaqaba aaaa@3496@  dans les conditions considérées. Des observations correspondantes pourraient être faites pour l’inférence fréquentiste de la vraisemblance composite par paire, considérée comme une fonction de vraisemblance approximative. Il est possible que de meilleurs résultats puissent être obtenus en appliquant une transformation adéquate à σ u ; MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfea0=yr0R Yxir=Jbba9q8aq0=yq=He9q8qqQ8frFve9Fve9Ff0dmeaabaqaciGa caGaaeqabaGaaiaadaaakeaacqaHdpWCdaWgaaWcbaGaamyDaaqaba GccaGG7aaaaa@355F@  le sujet pourrait faire l’objet de futurs travaux de recherche.

Une situation idéale pour l’utilisation de la vraisemblance composite dans l’inférence bayésienne en est une dans laquelle a) un modèle de génération des données est entièrement spécifié, de sorte qu’une fonction de vraisemblance véritable existe, et b) on peut raisonnablement estimer la vraisemblance véritable au moyen de la vraisemblance composite, de sorte que les lois a posteriori correspondantes aient une bonne concordance. Par exemple, pour Stoehr et Friel (2018), l’objectif est l’utilisation de l’inférence bayésienne d’une pseudo-vraisemblance pour les données issues d’un champ aléatoire de Gibbs. Ils établissent des identités qui lient le gradient et la matrice hessienne de la loi a posteriori du log pour un paramètre à des moments de statistiques suffisantes du champ aléatoire et les utilisent pour accroître la capacité de la log-densité a posteriori composite par paire à estimer la fonction de log-densité a posteriori. L’ajustement de la courbure de Ribatet, Cooley et Davison, sur lequel repose notre approche, porte plutôt sur le logarithme du rapport de vraisemblance composite par paire de sorte que son gradient (que nous pourrions appeler le « vecteur de score par paire ») présente la propriété d’absence de biais de l’information menant à des intervalles de crédibilité dont les probabilités de couverture fréquentistes se rapprochent des valeurs nominales. Intuitivement, compte tenu de l’augmentation du nombre n MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfea0=yr0R Yxir=Jbba9q8aq0=yq=He9q8qqQ8frFve9Fve9Ff0dmeaabaqaciGa caGaaeqabaGaaiaadaaakeaacaWGUbaaaa@32A0@  de grappes, m MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9v8qqaqFr0xc9pk0xbba9q8WqFfea0=yr0R Yxir=Jbba9q8aq0=yq=He9q8qqQ8frFve9Fve9Ff0dmeaabaqaciGa caGaaeqabaGaaiaadaaakeaacaWGTbaaaa@329F@  demeurant constant, cette approximation devrait s’améliorer et son calcul ne nécessite pas d’utiliser les propriétés de la vraisemblance elle-même. Dans le présent article, nous avons tiré profit de la disponibilité de la vraisemblance complète dans le cas simple pour évaluer dans quelle mesure l’inférence bayésienne fondée sur la vraisemblance composite par paire ajustée se rapproche de l’inférence bayésienne complète.

Remerciements

Les travaux de recherche sont financés en partie grâce à des subventions du Conseil de recherches en sciences naturelles et en génie du Canada accordées à Mary E. Thompson et à Grace Y. Yi. Grace Y. Yi est titulaire de la Chaire de recherche du Canada en sciences des données (niveau 1). Ses travaux de recherche ont été entrepris, en partie, grâce au financement du Programme des chaires de recherche du Canada.

Bibliographie

Cox, D.R., et Reid, N. (2004). A note on pseudo likelihood constructed from marginal densities. Biometrika, 91, 729-737.

Cruze, N., Erciulescu, A., Nandram, B., Barboza, W. et Young, L. (2019). Producing official county-level agricultural estimates in the United States: Needs and challenges. Statistical Science, 34, 301-316.

Erciulescu, A., Cruze, N. et Nandram, B. (2018). Benchmarking a triplet of official estimates. Environmental and Ecological Statistics, 23, 523-547.

Erciulescu, A., Cruze, N. et Nandram, B. (2019). Model-based county level crop estimates incorporating auxiliary sources of information. Journal of the Royal Statistical Society, Series A, 182, 283-303.

Erciulescu, A., Cruze, N. et Nandram, B. (2020). Statistical challenges in combining survey statistics and auxiliary data to produce official statistics. Journal of Official Statistics, 36, 63-88.

Gelman, A. (2006). Prior distributions for variance parameters in hierarchical models. Bayesian Analysis, 3, 515-533.

Heyde, C.C. (1997). Quasi-Likelihood and its Application: A General Approach to Optimal Parameter Estimation. New York: Springer-Verlag.

Jørgensen, B., et Knudsen, S.J. (2004). Parameter orthogonality and bias adjustment for estimating functions. Scandinavian Journal of Statistics, 31, 93-114.

Lehmann, E.L. (1999). Elements of Large-Sample Theory. New York: Springer-Verlag.

Léon-Novelo, L., et Savitsky, T. (2019). Fully Bayesian estimation under informative sampling. Electronic Journal of Statistics, 13, 1608-1645.

Lindsay, B.G. (1982). Conditional score functions: Some optimality results. Biometrika, 69, 505-512.

Lindsay, B.G. (1988). Composite likelihood methods. Contemporary Mathematics, 80, 220-239.

Lindsay, B.G., Yi, G.Y. et Sun, J. (2011). Issues and strategies in the selection of composite likelihoods. Statistica Sinica, 21, 71-105.

Nandram, B., Berg, E. et Barboza, W. (2014). A hierarchical Bayesian model for forecasting state-level corn yield. Journal of Environmental and Ecological Statistics, 21, 507-530.

Pfeffermann, D., Skinner, C.J., Holmes, D.J., Goldstein, H. et Rasbash, J. (1998). Weighting for unequal selection probabilities in multi-level models. Journal of the Royal Statistical Society, Series B, 60, 23-56.

Rao, J.N.K., Verret, F. et Hidiroglou, M.A. (2013). Une approche d’inférence fondée sur la vraisemblance composite pondérée pour des modèles à deux niveaux issus de données d’enquête. Techniques d’enquête, 39, 2, 263-282. Article accessible à l’adresse https://www150.statcan.gc.ca/n1/pub/12-001-x/2013002/article/11887-fra.pdf.

Rabe-Hesketh, S., et Skrondal, A. (2006). Multilevel modeling of complex survey data. Journal of the Royal Statistical Society, Series A, 169, 805-827.

Ribatet, M., Cooley, D. et Davison, A.C.D. (2012). Bayesian inference from composite likelihoods, with an application to spatial extremes. Statistica Sinica, 22, 813-845.

Sedransk, J. (2008). Assessing the value of Bayesian methods for inference about finite population quantities. Journal of Official Statistics, 24, 495-506.

Skinner, C.J., Holt, D. et Smith, T.F.M. (1989). Analysis of Complex Surveys. Wiley.

Stoehr, J., et Friel, N. (2018). Calibration of conditional composite likelihood for Bayesian inference on Gibbs random fields. Artificial Intelligence and Statistics, 921-929. arXiv:150201997v2.

Varin, C. (2008). On composite marginal likelihoods. AStA Advances in Statistical Analysis, 92, 1. https://doi.org/10.1007/s10182-008-0060-7 (consulté le 1er juillet 2020).

Varin, C., Reid, N. et Firth, D. (2011). An overview of composite likelihood methods. Statistica Sinica, 21, 5-24.

Yi, G.Y. (2017). Composite likelihood/pseudolikelihood. Wiley StatsRef: Statistics Reference Online. 1-14.

Yi, G.Y., Rao, J.N.K. et Li, H. (2016). A weighted composite likelihood approach for analysis of survey data under two-level models. Statistica Sinica, 26, 569-587.


Signaler un problème sur cette page

Quelque chose ne fonctionne pas? L'information n'est plus à jour? Vous ne trouvez pas ce que vous cherchez?

S'il vous plaît contactez-nous et nous informer comment nous pouvons vous aider.

Avis de confidentialité

Date de modification :