4 Applications

Peter M. Aronow et Cyrus Samii

Précédent | Suivant

La proposition 1 montre que le biais de l'estimateur de variance de Horvitz-Thompson sous non-mesurabilité est

A= kU l{U\k: π kl =0} y k y l . MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9LqFf0x e9q8qqvqFr0dXdHiVc=bYP0xb9sq=fFfeu0RXxb9qr0dd9q8qi0lf9 Fve9Fve9vapdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaaeaaaaaa aaa8qacaWGbbGaeyypa0Zaaabua8aabaWdbmaaqafapaqaa8qacaWG 5bWdamaaBaaaleaapeGaam4AaaWdaeqaaOWdbiaadMhapaWaaSbaaS qaa8qacaWGSbaapaqabaaabaWdbiaadYgacqGHiiIZcaGG7bGaamyv aiaacYfacaWGRbGaaiOoaiabec8aW9aadaWgaaadbaWdbiaadUgaca WGSbaapaqabaWcpeGaeyypa0JaaGimaiaac2haaeqaniabggHiLdaa l8aabaWdbiaadUgacqGHiiIZcaWGvbaabeqdcqGHris5aOGaaiOlaa aa@5691@

Cette expression, conjuguée au fait que A * A MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9LqFf0x e9q8qqvqFr0dXdHiVc=bYP0xb9sq=fFfeu0RXxb9qr0dd9q8qi0lf9 Fve9Fve9vapdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaaeaaaaaa aaa8qacaWGbbWdamaaCaaaleqabaWdbiaacQcaaaGccqGHLjYScaWG bbaaaa@3E0D@  indique clairement que le degré de biais dans Var ^ ( t ^ ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9LqFf0x e9q8qqvqFr0dXdHiVc=bYP0xb9sq=fFfeu0RXxb9qr0dd9q8qi0lf9 Fve9Fve9vapdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaaeaaaaaa aaa8qadaqiaaWdaeaapeGaaeOvaiaabggacaqGYbaacaGLcmaacaGG OaGabmiDayaajaGaaiykaaaa@3FAC@  et Var ^ C ( t ^ ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9LqFf0x e9q8qqvqFr0dXdHiVc=bYP0xb9sq=fFfeu0RXxb9qr0dd9q8qi0lf9 Fve9Fve9vapdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaaeaaaaaa aaa8qadaqiaaWdaeaapeGaaeOvaiaabggacaqGYbaacaGLcmaapaWa aSbaaSqaa8qacaWGdbaapaqabaGcpeGaaiikaiqadshagaqcaiaacM caaaa@40E8@  dépend beaucoup du nombre de paires pour lesquelles les probabilités d'inclusion sont nulles. Pour les plans pour lesquels ce nombre est faible, Var ^ ( t ^ ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9LqFf0x e9q8qqvqFr0dXdHiVc=bYP0xb9sq=fFfeu0RXxb9qr0dd9q8qi0lf9 Fve9Fve9vapdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaaeaaaaaa aaa8qadaqiaaWdaeaapeGaaeOvaiaabggacaqGYbaacaGLcmaacaGG OaGabmiDayaajaGaaiykaaaa@3FAC@  peut fournir un estimateur raisonnable et prudent quand y k MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9LqFf0x e9q8qqvqFr0dXdHiVc=bYP0xb9sq=fFfeu0RXxb9qr0dd9q8qi0lf9 Fve9Fve9vapdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaaeaaaaaa aaa8qacaWG5bWdamaaBaaaleaapeGaam4AaaWdaeqaaaaa@3BFF@  est de même signe pour tout k, MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9LqFf0x e9q8qqvqFr0dXdHiVc=bYP0xb9sq=fFfeu0RXxb9qr0dd9q8qi0lf9 Fve9Fve9vapdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaaeaaaaaa aaa8qacaWGRbGaaiilaaaa@3B57@  et Var ^ C ( t ^ ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9LqFf0x e9q8qqvqFr0dXdHiVc=bYP0xb9sq=fFfeu0RXxb9qr0dd9q8qi0lf9 Fve9Fve9vapdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaaeaaaaaa aaa8qadaqiaaWdaeaapeGaaeOvaiaabggacaqGYbaacaGLcmaapaWa aSbaaSqaa8qacaWGdbaapaqabaGcpeGaaiikaiqadshagaqcaiaacM caaaa@40E8@  peut fournir un estimateur raisonnable et prudent quand y k MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9LqFf0x e9q8qqvqFr0dXdHiVc=bYP0xb9sq=fFfeu0RXxb9qr0dd9q8qi0lf9 Fve9Fve9vapdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaaeaaaaaa aaa8qacaWG5bWdamaaBaaaleaapeGaam4AaaWdaeqaaaaa@3BFF@  peut prendre des signes différents pour certaines valeurs de k. MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9LqFf0x e9q8qqvqFr0dXdHiVc=bYP0xb9sq=fFfeu0RXxb9qr0dd9q8qi0lf9 Fve9Fve9vapdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaGaam4Aai aac6caaaa@3B39@  Un exemple observé fréquemment est celui de l'échantillonnage stratifié où, pour une proportion relativement faible de cas, nous avons de petites strates desquelles nous ne tirons qu'une seule unité.

Pour les plans qui aboutissent à de nombreuses paires dont les probabilités d'inclusion sont nulles, Var ^ ( t ^ ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9LqFf0x e9q8qqvqFr0dXdHiVc=bYP0xb9sq=fFfeu0RXxb9qr0dd9q8qi0lf9 Fve9Fve9vapdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaaeaaaaaa aaa8qadaqiaaWdaeaapeGaaeOvaiaabggacaqGYbaacaGLcmaacaGG OaGabmiDayaajaGaaiykaaaa@3FAC@  et Var ^ C ( t ^ ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9LqFf0x e9q8qqvqFr0dXdHiVc=bYP0xb9sq=fFfeu0RXxb9qr0dd9q8qi0lf9 Fve9Fve9vapdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaaeaaaaaa aaa8qadaqiaaWdaeaapeGaaeOvaiaabggacaqGYbaacaGLcmaapaWa aSbaaSqaa8qacaWGdbaapaqabaGcpeGaaiikaiqadshagaqcaiaacM caaaa@40E8@  pourraient être exagérément prudents et d'autres estimateurs pourraient être préférés sur la base de critères tels que l'erreur quadratique moyenne. Un exemple frappant est celui de l'échantillonnage systématique. En effet, Särndal et coll. (1992, page 76) suggèrent que, sous échantillonnage systématique, l'estimateur de variance de Horvitz-Thompson, Var ^ ( t ^ ), MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9LqFf0x e9q8qqvqFr0dXdHiVc=bYP0xb9sq=fFfeu0RXxb9qr0dd9q8qi0lf9 Fve9Fve9vapdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaaeaaaaaa aaa8qadaqiaaWdaeaapeGaaeOvaiaabggacaqGYbaacaGLcmaacaGG OaGabmiDayaajaGaaiykaiaacYcaaaa@405C@  peut donner un « résultat absurde ». L'expression pour A MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9LqFf0x e9q8qqvqFr0dXdHiVc=bYP0xb9sq=fFfeu0RXxb9qr0dd9q8qi0lf9 Fve9Fve9vapdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaGaamyqaa aa@3A5D@  indique clairement pourquoi il en serait ainsi. Wolter (2007, chapitre 8) montre que des estimateurs biaisés plus simples, tels que l'estimateur de variance avec remise (Hansen-Hurwitz), peuvent être fiables, si ce n'est légèrement prudents, pour une grande gamme de scénarios de données sous échantillonnage systématique avec probabilités égales et avec probabilités proportionnelles à la taille (PPT). Néanmoins, l'estimateur avec remise ne tient pas compte adéquatement de la variance d'échantillonnage quand la variance du résultat à l'intérieur des grappes de l'échantillon systématique est plus faible que la variance entre grappes. Dans de tels cas, Var ^ ( t ^ ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9LqFf0x e9q8qqvqFr0dXdHiVc=bYP0xb9sq=fFfeu0RXxb9qr0dd9q8qi0lf9 Fve9Fve9vapdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaaeaaaaaa aaa8qadaqiaaWdaeaapeGaaeOvaiaabggacaqGYbaacaGLcmaacaGG OaGabmiDayaajaGaaiykaaaa@3FAC@  bornerait cette variance en espérance quand les résultats sont tous de même signe, et Var ^ C ( t ^ ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9LqFf0x e9q8qqvqFr0dXdHiVc=bYP0xb9sq=fFfeu0RXxb9qr0dd9q8qi0lf9 Fve9Fve9vapdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaaeaaaaaa aaa8qadaqiaaWdaeaapeGaaeOvaiaabggacaqGYbaacaGLcmaapaWa aSbaaSqaa8qacaWGdbaapaqabaGcpeGaaiikaiqadshagaqcaiaacM caaaa@40E8@  bornerait systématiquement cette variance en espérance. Naturellement, il se pourrait encore que le biais soit trop grand pour que l'estimateur soit de beaucoup d'utilité, et nous ne suggérons donc pas que Var ^ ( t ^ ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9LqFf0x e9q8qqvqFr0dXdHiVc=bYP0xb9sq=fFfeu0RXxb9qr0dd9q8qi0lf9 Fve9Fve9vapdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaaeaaaaaa aaa8qadaqiaaWdaeaapeGaaeOvaiaabggacaqGYbaacaGLcmaacaGG OaGabmiDayaajaGaaiykaaaa@3FAC@  et Var ^ C ( t ^ ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9LqFf0x e9q8qqvqFr0dXdHiVc=bYP0xb9sq=fFfeu0RXxb9qr0dd9q8qi0lf9 Fve9Fve9vapdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaaeaaaaaa aaa8qadaqiaaWdaeaapeGaaeOvaiaabggacaqGYbaacaGLcmaapaWa aSbaaSqaa8qacaWGdbaapaqabaGcpeGaaiikaiqadshagaqcaiaacM caaaa@40E8@  fourniraient une solution complète au problème d'estimation de la variance pour l'échantillonnage systématique sous forte corrélation intra-grappe.

Les résultats des études en simulation peuvent être consultés dans un supplément (à l'adresse https://files.nyu.edu/cds2083/public/docs/smj_suppl.pdf). Ils illustrent les propriétés de Var ^ ( t ^ ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9LqFf0x e9q8qqvqFr0dXdHiVc=bYP0xb9sq=fFfeu0RXxb9qr0dd9q8qi0lf9 Fve9Fve9vapdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaaeaaaaaa aaa8qadaqiaaWdaeaapeGaaeOvaiaabggacaqGYbaacaGLcmaacaGG OaGabmiDayaajaGaaiykaaaa@3FAC@  et Var ^ C ( t ^ ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9LqFf0x e9q8qqvqFr0dXdHiVc=bYP0xb9sq=fFfeu0RXxb9qr0dd9q8qi0lf9 Fve9Fve9vapdbaqaaeGacaGaaiaabeqaamaabaabaaGcbaaeaaaaaa aaa8qadaqiaaWdaeaapeGaaeOvaiaabggacaqGYbaacaGLcmaapaWa aSbaaSqaa8qacaWGdbaapaqabaGcpeGaaiikaiqadshagaqcaiaacM caaaa@40E8@  comparativement à d'autres options utilisées fréquemment dans des scénarios appliqués. Les simulations illustrent des situations dans lesquelles ces estimateurs sont préférables aux autres options. Pour l'échantillonnage d'une unité par strate, nous montrons que ces estimateurs sont moins biaisés que l'estimateur sur « strate fusionnée » dans une gamme de scénarios. Pour l'échantillonnage systématique PPT, ces estimateurs donnent de bons résultats quand la population présente une périodicité importante, situation dans laquelle l'estimateur avec remise fréquemment utilisé peut présenter un biais négatif important.

Précédent | Suivant

Date de modification :