3. Échantillonnage

Piero Demetrio Falorsi et Paolo Righi

Précédent | Suivant

Soit z k MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4HqaqFfpeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXdbvk9qq=xd9qqaq=Jf9sr 0=vr0=vrWZqaaeaabiGaaiaacaqabeaadaqaaqaaaOqaaiaahQhada WgaaWcbaGaam4Aaaqabaaaaa@3ACD@ un vecteur de variables auxiliaires disponible pour toutes les unités k U . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4HqaqFfpeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXdbvk9qq=xd9qqaq=Jf9sr 0=vr0=vrWZqaaeaabiGaaiaacaqabeaadaqaaqaaaOqaaiaadUgacq GHiiIZcaWGvbGaaiOlaaaa@3CAE@ Un plan d’échantillonnage p ( s ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4HqaqFfpeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXdbvk9qq=xd9qqaq=Jf9sr 0=vr0=vrWZqaaeaabiGaaiaacaqabeaadaqaaqaaaOqaaiaadchada qadeqaaiaadohaaiaawIcacaGLPaaaaaa@3C25@ est dit équilibré sur les variables auxiliaires si, et seulement si, il satisfait les équations d’équilibrage suivantes

                                              k s z k π k = k U z k ( 3.1 ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4HqaqFfpeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXdbvk9qq=xd9qqaq=Jf9sr 0=vr0=vrWZqaaeaabiGaaiaacaqabeaadaqaaqaaaOqaamaaqababa WaaSaaaeaacaWH6bWaaSbaaSqaaiaadUgaaeqaaaGcbaGaeqiWda3a aSbaaSqaaiaadUgaaeqaaaaaaeaacaWGRbGaeyicI4Saam4Caaqab0 GaeyyeIuoakiabg2da9maaqababaGaaCOEamaaBaaaleaacaWGRbaa beaaaeaacaWGRbGaeyicI4Saamyvaaqab0GaeyyeIuoakiaaywW7ca aMf8UaaGzbVlaaywW7caaMf8UaaiikaiaaiodacaGGUaGaaGymaiaa cMcaaaa@56AB@

pour chaque échantillon s MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4HqaqFfpeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXdbvk9qq=xd9qqaq=Jf9sr 0=vr0=vrWZqaaeaabiGaaiaacaqabeaadaqaaqaaaOqaaiaadohaaa a@39A6@ tel que p ( s ) > 0 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4HqaqFfpeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXdbvk9qq=xd9qqaq=Jf9sr 0=vr0=vrWZqaaeaabiGaaiaacaqabeaadaqaaqaaaOqaaiaadchada qadeqaaiaadohaaiaawIcacaGLPaaatCvAUfKttLearyWrPrgz5vhC GmfDKbacfaGae8Npa4JaaGimaaaa@4491@ (Deville et Tillé 2004). Selon les variables auxiliaires et les probabilités d’inclusion, l’équation (3.1) peut être exactement ou approximativement satisfaite dans chaque échantillon possible; par conséquent, un plan d’échantillonnage équilibré n’existe pas toujours. En spécifiant

z k = π k δ k , ( 3.2 ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4HqaqFfpeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXdbvk9qq=xd9qqaq=Jf9sr 0=vr0=vrWZqaaeaabiGaaiaacaqabeaadaqaaqaaaOqaaiaahQhada WgaaWcbaGaam4AaaqabaGccqGH9aqpcqaHapaCdaWgaaWcbaGaam4A aaqabaGccaWH0oWaaSbaaSqaaiaadUgaaeqaaOGaaiilaiaaywW7ca aMf8UaaGzbVlaaywW7caaMf8UaaiikaiaaiodacaGGUaGaaGOmaiaa cMcaaaa@4D1F@

les équations (3.1) deviennent

k s δ k = k U π k δ k . ( 3.3 ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4HqaqFfpeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXdbvk9qq=xd9qqaq=Jf9sr 0=vr0=vrWZqaaeaabiGaaiaacaqabeaadaqaaqaaaOqaamaaqababa GaaCiTdmaaBaaaleaacaWGRbaabeaaaeaacaWGRbGaeyicI4Saam4C aaqab0GaeyyeIuoakiabg2da9maaqababaGaeqiWda3aaSbaaSqaai aadUgaaeqaaOGaaCiTdmaaBaaaleaacaWGRbaabeaaaeaacaWGRbGa eyicI4Saamyvaaqab0GaeyyeIuoakiaac6cacaaMf8UaaGzbVlaayw W7caaMf8UaaGzbVlaacIcacaaIZaGaaiOlaiaaiodacaGGPaaaaa@57C9@

Dans ce cas, les équations d’équilibrage stipulent que la taille d’échantillon réalisée dans chaque sous-population U h MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4HqaqFfpeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXdbvk9qq=xd9qqaq=Jf9sr 0=vr0=vrWZqaaeaabiGaaiaacaqabeaadaqaaqaaaOqaaiaadwfada WgaaWcbaGaamiAaaqabaaaaa@3AA1@ est égale à la taille prévue. Dans différents contextes, Ernst (1989) et Deville et Tillé (2004; page 905 Section 7.3) ont prouvé que i) sous la spécification (3.2) et ii) si le vecteur des tailles prévues d’échantillon, données par n = k U π k δ k , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4HqaqFfpeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXdbvk9qq=xd9qqaq=Jf9sr 0=vr0=vrWZqaaeaabiGaaiaacaqabeaadaqaaqaaaOqaaiaah6gacq GH9aqpdaaeqaqaaiabec8aWnaaBaaaleaacaWGRbaabeaakiaahs7a daWgaaWcbaGaam4AaaqabaaabaGaam4AaiabgIGiolaadwfaaeqani abggHiLdGccaGGSaaaaa@45CA@ ne contient que des nombres entiers, alors un plan d’échantillonnage équilibré existe toujours. La spécification (3.2) définit des plans d’échantillonnage qui garantissent le respect de l’équation (2.4) sur laquelle nous souhaitons nous concentrer. Deville et Tillé (2004, pages 895 et 905), Deville et Tillé (2005, page 577) et Tillé (2006, page 168) ont montré que plusieurs plans d’échantillonnage habituels peuvent être considérés comme des cas particuliers de l’échantillonnage équilibré, en définissant de manière appropriée les vecteurs π MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4HqaqFfpeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXdbvk9qq=xd9qqaq=Jf9sr 0=vr0=vrWZqaaeaabiGaaiaacaqabeaadaqaaqaaaOqaaiaahc8aaa a@39FA@ et δ k MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4HqaqFfpeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXdbvk9qq=xd9qqaq=Jf9sr 0=vr0=vrWZqaaeaabiGaaiaacaqabeaadaqaaqaaaOqaaiaahs7ada WgaaWcbaGaam4Aaaqabaaaaa@3B0A@ de l’équation (3.2). Ces problèmes sont illustrés à la remarque 4.2 et à la section 6. Des échantillons équilibrés peuvent être tirés par la méthode du cube (Deville et Tillé 2004). Cette méthode facilite grandement la sélection sous des plans d’échantillonnage stratifiés incomplets en permettant de contourner les inconvénients de calcul des méthodes fondées sur des algorithmes de programmation linéaire (Lu et Sitter 2002). La méthode du cube satisfait exactement les équations (3.1) quand la spécification (3.2) est vérifiée et que n MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4HqaqFfpeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXdbvk9qq=xd9qqaq=Jf9sr 0=vr0=vrWZqaaeaabiGaaiaacaqabeaadaqaaqaaaOqaaiaah6gaaa a@39A5@ est un vecteur de nombres entiers. Dans les cas de l’EASSR et de l’EASSRS, on peut utiliser les méthodes classiques de sélection de l’échantillon, ainsi que la méthode du cube. Deville et Tillé (2005) proposent une approximation de la variance pour l’estimateur HT sous-échantillonnage équilibré

E p ( t ^ ( d r ) t ( d r ) ) 2 [ N / ( N H ) ] [ k U ( 1 / π k 1 ) η ( d r ) k 2 ] ( 3.4 ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4HqaqFfpeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXdbvk9qq=xd9qqaq=Jf9sr 0=vr0=vrWZqaaeaabiGaaiaacaqabeaadaqaaqaaaOqaaiaadweada WgaaWcbaGaamiCaaqabaGcdaqadeqaaiqadshagaqcamaaBaaaleaa daqadeqaaiaadsgacaWGYbaacaGLOaGaayzkaaaabeaakiabgkHiTi aadshadaWgaaWcbaWaaeWabeaacaWGKbGaamOCaaGaayjkaiaawMca aaqabaaakiaawIcacaGLPaaadaahaaWcbeqaaiaaikdaaaGccqGHfj cqdaWadaqaamaalyaabaGaamOtaaqaamaabmaabaGaamOtaiabgkHi TiaadIeaaiaawIcacaGLPaaaaaaacaGLBbGaayzxaaWaamWaaeaada aeqaqaamaabmqabaWaaSGbaeaacaaIXaaabaGaeqiWda3aaSbaaSqa aiaadUgaaeqaaOGaeyOeI0IaaGymaaaaaiaawIcacaGLPaaacqaH3o aAdaqhaaWcbaWaaeWabeaacaWGKbGaamOCaaGaayjkaiaawMcaaiaa dUgaaeaacaaIYaaaaaqaaiaadUgacqGHiiIZcaWGvbaabeqdcqGHri s5aaGccaGLBbGaayzxaaGaaGzbVlaaywW7caaMf8UaaGzbVlaaywW7 caGGOaGaaG4maiaac6cacaaI0aGaaiykaaaa@6FB5@

E p MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4HqaqFfpeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXdbvk9qq=xd9qqaq=Jf9sr 0=vr0=vrWZqaaeaabiGaaiaacaqabeaadaqaaqaaaOqaaiaadweada WgaaWcbaGaamiCaaqabaaaaa@3A99@ désigne l’espérance d’échantillon et

η ( d r ) k = y r k γ d k π k δ k [ A ( π ) ] 1 j U π j ( 1 / π j 1 ) δ j y r k γ d k ( 3.5 ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4HqaqFfpeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXdbvk9qq=xd9qqaq=Jf9sr 0=vr0=vrWZqaaeaabiGaaiaacaqabeaadaqaaqaaaOqaaiabeE7aOn aaBaaaleaadaqadeqaaiaadsgacaWGYbaacaGLOaGaayzkaaGaam4A aaqabaGccqGH9aqpcaWG5bWaaSbaaSqaaiaadkhacaWGRbaabeaaki abeo7aNnaaBaaaleaacaWGKbGaam4AaaqabaGccqGHsislcqaHapaC daWgaaWcbaGaam4AaaqabaGcceWH0oGbauaadaWgaaWcbaGaam4Aaa qabaGcdaWadaqaaiaahgeadaqadeqaaiaahc8aaiaawIcacaGLPaaa aiaawUfacaGLDbaadaahaaWcbeqaaiabgkHiTiaaigdaaaGcdaaeqa qaaiabec8aWnaaBaaaleaacaWGQbaabeaakmaabmqabaWaaSGbaeaa caaIXaaabaGaeqiWda3aaSbaaSqaaiaadQgaaeqaaOGaeyOeI0IaaG ymaaaaaiaawIcacaGLPaaacaWH0oWaaSbaaSqaaiaadQgaaeqaaOGa amyEamaaBaaaleaacaWGYbGaam4AaaqabaGccqaHZoWzdaWgaaWcba GaamizaiaadUgaaeqaaaqaaiaadQgacqGHiiIZcaWGvbaabeqdcqGH ris5aOGaaGzbVlaaywW7caaMf8UaaGzbVlaaywW7caGGOaGaaG4mai aac6cacaaI1aGaaiykaaaa@77E2@

avec

A ( π ) = j U δ j δ j π j ( 1 π j ) . ( 3.6 ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4HqaqFfpeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXdbvk9qq=xd9qqaq=Jf9sr 0=vr0=vrWZqaaeaabiGaaiaacaqabeaadaqaaqaaaOqaaiaahgeada qadeqaaiaahc8aaiaawIcacaGLPaaacqGH9aqpdaaeqaqaaiaahs7a daWgaaWcbaGaamOAaaqabaGcceWH0oGbauaadaWgaaWcbaGaamOAaa qabaGccqaHapaCdaWgaaWcbaGaamOAaaqabaGcdaqadeqaaiaaigda cqGHsislcqaHapaCdaWgaaWcbaGaamOAaaqabaaakiaawIcacaGLPa aaaSqaaiaadQgacqGHiiIZcaWGvbaabeqdcqGHris5aOGaaiOlaiaa ywW7caaMf8UaaGzbVlaaywW7caaMf8UaaiikaiaaiodacaGGUaGaaG OnaiaacMcaaaa@5C59@

Les résultats de simulations donnés récemment dans Breidt et Chauvet (2011) confirment que l’équation (3.4) représente une bonne approximation de la variance d’échantillonnage quand les équations d’équilibrage sont satisfaites exactement. L’estimation de la variance est étudiée dans Deville et Tillé(2005).

Précédent | Suivant

Date de modification :