Estimation sur petits domaines portant sur des chiffres pondérés d’enquête dans un modèle spatial à niveau agrégé

Section 5. Observations en conclusion

Dans cet article, nous décrivons une extension spatiale de la version au niveau du domaine du MLGM et considérons l’estimation sur petits domaines des proportions pondérées selon l’enquête dans ce modèle. Nous introduisons la dépendance spatiale dans la structure des erreurs du MLGM par un processus autorégressif simultané (ARS). Nous examinons les différentes façons d’intégrer la dépendance spatiale résultante aux estimations sur petits domaines. Nous faisons intervenir une taille et un chiffre d’échantillon efficaces pour tenir compte du plan de sondage. Nous décrivons également un estimateur EQM analytique. Nous appliquons ensuite ces méthodes d’EPD à des données réelles d’enquête pour estimer la fréquence de la pauvreté en milieu rural et produire une carte correspondante de la pauvreté dans les différents districts de l’État d’Uttar Pradesh en Inde. Nous évaluons nos résultats empiriques par plusieurs mesures de diagnostic et démontrons que les méthodes d’EPD par modèle font faire des gains d’efficacité dans l’estimation au niveau des districts des proportions de ménages pauvres. Ajoutons que, lorsque nous utilisons la corrélation spatiale entre les districts d’une manière appropriée, les estimations par modèle mènent à des gains significatifs d’efficacité des estimations au niveau des districts. Dans le cas de ces données, une mesure de proximité spatiale définie comme une fonction gaussienne des distances entre les districts semble le meilleur moyen de tenir compte de l’association spatiale entre ceux-ci. Disons enfin que l’exploitation de l’information d’enquête par l’emploi d’une taille d’échantillon efficace permet des estimations plus représentatives et réalistes.

Dans le contexte de l’estimation des dénombrements de petits domaines dans des modèles de petits domaines au niveau des unités, D’Alò, Di Consiglio, Falorsi, Ranalli et Solari (2012) décrivent plusieurs façons d’inclure dans l’analyse l’information spatiale par différentes mesures de distance. Il serait donc bon de sonder ces possibilités d’introduire l’information spatiale dans les versions au niveau du domaine des modèles correspondants de petits domaines. Dans notre article, nous employons également une structure d’autorégression simultanée pour appréhender la dépendance spatiale dans le MLGM. Comme nous l’avons indiqué, d’autres moyens comme les modèles autorégressifs conditionnels et les modèles nouvellement conçus de non-stationnarité spatiale peuvent servir à caractériser cette dépendance. Voir, par exemple, Besag et coll. (1991), Leroux et coll. (1999) et Chandra et coll. (2017, 2018). Ce sont des méthodes à explorer et nous sommes en train de les étudier.

Il convient enfin de noter que les estimations au niveau des districts de la fréquence de la pauvreté en milieu rural par les méthodes que nous avons décrites seront utiles à divers ministères du gouvernement indien et aux organisations internationales dans leur planification stratégique et leur recherche en politiques. Elles faciliteront aussi les affectations budgétaires et le ciblage des interventions en matière de bien-être en faisant connaître les districts ou les régions se caractérisant par une haute fréquence de la pauvreté rurale. Notre application est enfin la preuve que l’EPD peut constituer un moyen rentable et efficace de production de statistiques fiables désagrégées à partir des données d’enquête existantes grâce à une combinaison de l’information auxiliaire tirée de différentes sources publiées et des estimations directes d’enquête.

Remerciements

Les auteurs remercient de leurs observations et leurs suggestions utiles le rédacteur en chef, le rédacteur adjoint et les trois examinateurs. Elles auront permis d’améliorer considérablement notre article. Hukum Chandra a réalisé cette étude dans le cadre d’un projet national pour attachés de recherche de l’ICAR-IASRI à New Delhi en Inde. Le travail de Nicola Salvati a été subventionné par le Progetto di Ricerca di Ateneo du Survey-based to register-based statistics: a paradigm shift using latent variable models (subvention PRA2018-19).

Bibliographie

Anselin, L. (1992). Spatial Econometrics. Methods and Models. Kluwer Academic, Boston.

Banerjee, S., Carlin, B. et Gelfand, A. (2004). Hierarchical Modelling and Analysis for Spatial Data. New York: Chapman and Hall.

Besag, J., York, J. et Mollié, A. (1991). Bayesian image restoration with two applications in spatial statistics. Annals of the Institute of Statistical Mathematics, 43, 1-59.

Breslow, N.E., et Clayton, D.G. (1993). Approximate inference in generalized linear mixed models. Journal of the American Statistics Association, 88(421), 9-25.

Brown, G., Chambers, R., Heady, P. et Heasman, D. (2001). Évaluation des méthodes d’estimation régionale dans leur application aux estimations du chômage tirées de l’Enquête sur la population active au Royaume-Uni. Recueil : Symposium 2001, La qualité des données d’un organisme statistique : une perspective méthodologique, Statistique Canada.

Chandra, H. (2013). Exploring spatial dependence in area level random effect model for disaggregate level crop yield estimation. Journal of Applied Statistics, 40, 823-842.

Chandra, H., et Salvati, N. (2018). Small area estimation for count data under a spatial dependent aggregated level random effects model. Communications in Statistics - Theory and Methods, 47(5), 1234-1255.

Chandra, H., Chambers, R. et Salvati, N. (2012). Small area estimation of proportions in business surveys. Journal of Statistical Computation and Simulation, 82(6), 783-795.

Chandra, H., Salvati, N. et Chambers, R. (2017). Small area prediction of counts under a non-stationary spatial model. Spatial Statistics, 20, 30-56.

Chandra, H., Salvati, N. et Chambers, R. (2018). Small area estimation under a spatially non-linear model. Computational Statistics and Data Analysis, 126, 19-38.

Chandra, H., Salvati, N. et Sud, U.C. (2011). Disaggregate-level estimates of indebtedness in the state of Uttar Pradesh in India-an application of small area estimation technique. Journal of Applied Statistics, 38(11), 2413-2432.

Cressie, N. (1993). Statistics for Spatial Data. New York: John Wiley & Sons, Inc.

D’Alò, M., Di Consiglio, L., Falorsi, S., Ranalli, M.G. et Solari, F. (2012). Use of spatial information in small area models for unemployment rate estimation at sub-provincial areas in Italy. Journal of the Indian Society of Agricultural Statistics, Special issue on small area estimation, 66(1), 43-54.

Fay, R.E., et Herriot, R. (1979). Estimates of income for small places: An application of James Stein procedures to census data. Journal of the American Statistical Association, 74, 269-277.

Fotheringham, A.S., Brunsdon, C. et Charlton, M.E. (2002). Geographically Weighted Regression. New York: John Wiley & Sons, Inc., West Sussex.

Franco, C., et Bell, W.R. (2013). Applying bivariate binomial/logit normal models to small area estimation. Proceedings of the Joint Statistical Meetings, Section on Survey Research Methods, American Statistical Association, Alexandria, VA, 690-702.

Ghosh, M., Natarajan, K., Stroud, T.W.F. et Carlin, B.P. (1998). Generalized linear model for small-area estimation. Journal of the American Statistical Association, 93, 273-282.

Jiang, J. (2003). Empirical best prediction for small-area inference based on generalized linear mixed models. Journal of Statistical Planning Inference, 111, 117-127.

Johnson, F.A., Chandra, H., Brown, J. et Padmadas, S. (2010). Estimating district-level births attended by skilled attendants in Ghana using demographic health survey and census data: An application of small area estimation technique. Journal of Official Statistics, 26(2), 341-359.

Korn, E.L., et Graubard, B.I. (1998). Intervalles de confiance pour les proportions à petit nombre d’événements positifs prévus estimées au moyen des données d’enquête. Techniques d’enquête, 24, 2, 209-218. Article accessible à l’adresse https://www150.statcan.gc.ca/n1/en/pub/12-001-x/1998002/article/4356-fra.pdf.

Leroux, B., Lei, X. et Breslow, N. (1999). Estimation of disease rates in small areas: A new mixed model for spatial dependence. Dans Statistical Models in Epidemiology, the Environment and Clinical Trials, (Éds., M. Halloran et D. Berry), 135-178. New York: Springer-Verlag.

Liu, B., Lahiri, P. et Kalton, G. (2014). Modélisation hiérarchique bayésienne de proportions dans de petits domaines pondérées par les poids de sondage. Techniques d’enquête, 40, 1, 1-15. Article accessible à l’adresse https://www150.statcan.gc.ca/n1/en/pub/12-001-x/2014001/article/14030-fra.pdf.

Lopez-Vizcaino, E., Lombardìa, M. et Morales, D. (2013). Multinomial-based small area estimation of labour force indicators. Statististcal Modelling, 13, 153-178.

Malec, D., Sedransk, J., Moriarity, C.L. et LeClere, F.B. (1997). Small area inference for binary variables in the national health interview survey. Journal of the American Statistical Association, 92, 815-826.

Manteiga, G.W., Lombardia, M.J., Molina, I., Morales, D. et Santamarìa, L. (2007). Estimation of the mean squared error of predictors of small area linear parameters under a logistic mixed model. Computational Statistics and Data Analysis, 51, 2720-2733.

Marhuenda, Y., Molina, I. et Morales, D. (2013). Small area estimation with spatio-temporal Fay-Herriot models. Computational Statistics and Data Analysis, 58, 308-325.

McGilchrist, C.E. (1994). Estimation in generalized mixed models. Journal of the Royal Statistical Society B, 56, 61-69.

Mercer, L., Wakefield, J., Chen, C. et Lumley, T. (2014). A comparison of spatial smoothing methods for small area estimation with sampling weights. Spatial Statistics, 8, 69-85.

Molina, I., Saei, A. et José Lombardìa, M. (2007). Small area estimates of labour force participation under a multinomial logit mixed model. J. R. Statist. Soc. A, 170, 975-1000.

Molina, I., Salvati, N. et Pratesi, M. (2009). Bootstrap for estimating the MSE of the spatial EBLUP. Computational Statistics, 24, 441-458.

Pfeffermann, D. (2002). Small area estimation: New developments and directions. Revue Internationale de Statistique, 70, 125-143.

Porter, A.T., Wikle, C.K. et Holan, S.H. (2015). Small area estimation via multivariate Fay-Herriot models with latent spatial dependence. Australian and New Zealand Journal of Statistics, 57, 15-29.

Pratesi, M., et Salvati, N. (2008). Small area estimation - the EBLUP estimator based on spatially correlated random area effects. Statistical Methods and Applications, 17, 114-131.

Pratesi, M., et Salvati, N. (2009). Small area estimation in the presence of correlated random area effects. Journal of Official Statistics, 25, 37-53.

Rao, J.N.K. (2003). Small Area Estimation. New York: John Wiley & Sons, Inc.

Rao, J.N.K., et Molina, I. (2015). Small Area Estimation, 2nd Edition. New York: John Wiley & Sons, Inc.

Saei, A., et Chambers, R. (2003). Small area estimation under linear and generalized linear mixed models with time and area effects. Southampton Statistical Sciences Research Institute, documents de travail de la méthodologie S3RI, M03/15.

Salvati, N., Chandra, H. et Chambers, R. (2012). Model based direct estimation of small area distributions. Australian & New Zealand Journal of Statistics, 54(1), 103-123.

Särndal, C.-E., Swensson, B. et Wretman, J.H. (1992). Model Assisted Survey Sampling. New York: Springer-Verlag.

Singh, B.B., Shukla, G.K. et Kundu, D. (2005). Modèles spatio-temporels pour l’estimation pour petits domaines. Techniques d’enquête, 31, 2, 201-214. Article accessible à l’adresse https://www150.statcan.gc.ca/n1/en/pub/12-001-x/2005002/article/9053-fra.pdf.

Tzavidis, N., Salvati, N., Pratesi, M. et Chambers, R. (2008). M-quantile models with application to poverty mapping. Statistical Methods & Applications, 17(3), 393-411.


Signaler un problème sur cette page

Quelque chose ne fonctionne pas? L'information n'est plus à jour? Vous ne trouvez pas ce que vous cherchez?

S'il vous plaît contactez-nous et nous informer comment nous pouvons vous aider.

Avis de confidentialité

Date de modification :