Remarque concernant l’estimation par régression lorsque la taille de la population est inconnue 5. Conclusions

L’estimateur par régression peut être très efficace lorsque les données auxiliaires qu’il utilise sont bien corrélées avec la variable d’intérêt. Il faut aussi que les totaux de population correspondant aux variables auxiliaires soient disponibles. Dans cet article, nous avons examiné le comportement de l’estimateur par régression ( Y ^ SREG ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9Lq=Je9 vqaqFeFr0xbbG8FaYPYRWFb9fi0FXxbbf9Ff0dfrpm0dXdHqVu0=vr 0=vr0=fdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaWaaeWaaeaace WGzbGbaKaadaWgaaWcbaGaae4uaiaabkfacaqGfbGaae4raaqabaaa kiaawIcacaGLPaaaaaa@3D16@  proposé par Singh et Raghunath (2011). Cet estimateur utilise le total estimé de la population comme total de contrôle et les totaux de population connus des variables auxiliaires. Nous l’avons comparé à l’estimateur par régression généralisée ( Y ^ GREG ) , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9Lq=Je9 vqaqFeFr0xbbG8FaYPYRWFb9fi0FXxbbf9Ff0dfrpm0dXdHqVu0=vr 0=vr0=fdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaWaaeWaaeaace WGzbGbaKaadaWgaaWcbaGaae4raiaabkfacaqGfbGaae4raaqabaaa kiaawIcacaGLPaaacaGGSaaaaa@3DBA@  son analogue optimal ( Y ^ OPT ) , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9Lq=Je9 vqaqFeFr0xbbG8FaYPYRWFb9fi0FXxbbf9Ff0dfrpm0dXdHqVu0=vr 0=vr0=fdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaWaaeWaaeaace WGzbGbaKaadaWgaaWcbaGaae4taiaabcfacaqGubaabeaaaOGaayjk aiaawMcaaiaacYcaaaa@3D05@  et à un estimateur de rechange ( Y ^ KREG ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9Lq=Je9 vqaqFeFr0xbbG8FaYPYRWFb9fi0FXxbbf9Ff0dfrpm0dXdHqVu0=vr 0=vr0=fdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaWaaeWaaeaace WGzbGbaKaadaWgaaWcbaGaae4saiaabkfacaqGfbGaae4raaqabaaa kiaawIcacaGLPaaaaaa@3D0E@  qui utilise les probabilités d’inclusion de premier ordre et les données auxiliaires pour lesquelles les totaux de population sont connus. Comme l’estimateur par régression optimale nécessite le calcul des probabilités d’inclusion de second ordre, nous avons aussi inclus un estimateur pseudo-optimal ( Y ^ POPT ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9Lq=Je9 vqaqFeFr0xbbG8FaYPYRWFb9fi0FXxbbf9Ff0dfrpm0dXdHqVu0=vr 0=vr0=fdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaWaaeWaaeaace WGzbGbaKaadaWgaaWcbaGaaeiuaiaab+eacaqGqbGaaeivaaqabaaa kiaawIcacaGLPaaaaaa@3D28@  qui n’utilise pas ces probabilités. Nous avons examiné les propriétés de ces estimateurs en termes de biais et d’efficacité au moyen d’une simulation incluant différents plans de sondage et différentes valeurs de l’ordonnée à l’origine dans le modèle pour une population artificielle générée. Nous avons comparé les résultats obtenus lorsque la taille de la population était connue et inconnue.

Lorsque la taille de population est connue, l’estimateur optimal Y ^ OPT MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9Lq=Je9 vqaqFeFr0xbbG8FaYPYRWFb9fi0FXxbbf9Ff0dfrpm0dXdHqVu0=vr 0=vr0=fdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaGabmywayaaja WaaSbaaSqaaiGac+eacaGGqbGaaiivaaqabaaaaa@3AC7@ est le plus efficace. Cependant, comme cet estimateur peut être instable, l’estimateur pseudo-optimal Y ^ POPT MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9Lq=Je9 vqaqFeFr0xbbG8FaYPYRWFb9fi0FXxbbf9Ff0dfrpm0dXdHqVu0=vr 0=vr0=fdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaGabmywayaaja WaaSbaaSqaaiaabcfacaqGpbGaaeiuaiaabsfaaeqaaaaa@3B95@ est un bon substitut. Notre conclusion concorde avec celle de Rao (1994), qui préférait l’estimateur optimal Y ^ POPT MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9Lq=Je9 vqaqFeFr0xbbG8FaYPYRWFb9fi0FXxbbf9Ff0dfrpm0dXdHqVu0=vr 0=vr0=fdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaGabmywayaaja WaaSbaaSqaaiaabcfacaqGpbGaaeiuaiaabsfaaeqaaaaa@3B95@ à l’estimateur par régression généralisée Y ^ GREG . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9Lq=Je9 vqaqFeFr0xbbG8FaYPYRWFb9fi0FXxbbf9Ff0dfrpm0dXdHqVu0=vr 0=vr0=fdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaGabmywayaaja WaaSbaaSqaaiaabEeacaqGsbGaaeyraiaabEeaaeqaaOGaaiOlaaaa @3C33@ La proposition de Singh et Raghunath (2011), qui recommandaient d’utiliser Y ^ SREG , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9Lq=Je9 vqaqFeFr0xbbG8FaYPYRWFb9fi0FXxbbf9Ff0dfrpm0dXdHqVu0=vr 0=vr0=fdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaGabmywayaaja WaaSbaaSqaaiaabofacaqGsbGaaeyraiaabEeaaeqaaOGaaiilaaaa @3C3D@ n’est pas viable, car cet estimateur peut être très inefficace. Lorsque la taille de la population est inconnue, l’estimateur de rechange par régression Y ^ KREG MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9Lq=Je9 vqaqFeFr0xbbG8FaYPYRWFb9fi0FXxbbf9Ff0dfrpm0dXdHqVu0=vr 0=vr0=fdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaGabmywayaaja WaaSbaaSqaaiaabUeacaqGsbGaaeyraiaabEeaaeqaaaaa@3B7B@ donne les meilleurs résultats.

Remerciements

Les auteurs remercient le rédacteur associé et les arbitres pour leurs suggestions qui ont considérablement améliorées la qualité de cet article.

Bibliographie

Cassel, C.M., Särndal, C.-E. et Wretman, J.H. (1976). Some results on generalized difference estimators and generalized regression estimation for finite populations. Biometrika, 63, 615-620.

Fuller, W.A. (2009). Sampling Statistics. New York : John Wiley & Sons, Inc.

Horvitz, D.G., et Thompson, D.J. (1952). A generalization of sampling without replacement from a finite universe. Journal of the American Statistical Association, 47, 663-685.

Isaki, C.T., et Fuller, W.A. (1982). Survey design under the regression superpopulation model. Journal of the American Statistical Association, 77, 89-96.

Midzuno, H. (1952). On the sampling system with probability proportional to sum of size. Annals of the Institute of Statistical Mathematics, 3, 99-107.

Montanari, G.E. (1987). Post-sampling efficient QR-prediction in large-scale surveys. Revue Internationale de Statistique, 55, 191-202.

Montanari, G.E. (1998). Estimation de la moyenne d’une population finie par régression. Techniques d’enquête, 24, 1, 71-79.

Rao, J.N.K. (1994). Estimating totals and distribution functions using auxiliary data information at the estimation stage. Journal of Official Statistics, 10(2), 153-165.

Rosner, B. (2006). Fundamentals of Biostatistics. Sixième édition, Duxbury Press.

Sampford, M.R. (1967). On sampling without replacement with unequal probabilities of section. Biometrika, 54, 499-513.

Särndal, C.-E., Swensson, B. et Wretman, J. (1992). Model Assisted Survey Sampling. New York : Springer-Verlag.

Singh, S., et Raghunath, A. (2011). On calibration of design weights. METRON International Journal of Statistics, vol. LXIX, 2, 185-205.

Date de modification :