Un algorithme d’optimisation appliqué au problème de stratification unidimensionnelle
Section 3. Le problème de stratification unidimensionnelle

Considérons le vecteur de population X U = { x 1 , x 2 , , x N } MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWGybWaaSbaaSqaaiaadwfaaeqaaO Gaeyypa0ZaaiWaaeaacaWG4bWaaSbaaSqaaiaaigdaaeqaaOGaaiil aiaaysW7caWG4bWaaSbaaSqaaiaaikdaaeqaaOGaaiilaiaaysW7cq WIMaYscaGGSaGaaGjbVlaadIhadaWgaaWcbaGaamOtaaqabaaakiaa wUhacaGL9baaaaa@449B@ correspondant à la variable de stratification x . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWG4bGaaiOlaaaa@336A@ Sans perte de généralité, nous posons que les éléments de population dans U MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWGvbaaaa@3295@ sont ordonnés par la variable de stratification, de sorte que x 1 x 2 x N . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWG4bWaaSbaaSqaaiaaigdaaeqaaO GaeyizImQaamiEamaaBaaaleaacaaIYaaabeaakiabgsMiJkablAci ljabgsMiJkaadIhadaWgaaWcbaGaamOtaaqabaGccaGGUaaaaa@3E91@ Nous faisons intervenir les bornes de strate pour définir les H MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWGibaaaa@3288@ strates par la règle suivante :

  1. U 1 = { i U | x i b 1 } ; MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWGvbWaaSbaaSqaaiaaigdaaeqaaO Gaeyypa0ZaaiWaaeaacaaMi8UaamyAaiabgIGiopaaeiaabaGaamyv aiaaykW7aiaawIa7aiaaykW7caWG4bWaaSbaaSqaaiaadMgaaeqaaO GaeyizImQaamOyamaaBaaaleaacaaIXaaabeaaaOGaay5Eaiaaw2ha aiaacUdaaaa@46B3@
  2. U h = { i U | b h 1 < x i b h } MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWGvbWaaSbaaSqaaiaadIgaaeqaaO Gaeyypa0ZaaiWaaeaacaaMi8UaamyAaiabgIGiopaaeiaabaGaamyv aiaaykW7aiaawIa7aiaaykW7caWGIbWaaSbaaSqaaiaadIgacqGHsi slcaaIXaaabeaakiabgYda8iaadIhadaWgaaWcbaGaamyAaaqabaGc cqGHKjYOcaWGIbWaaSbaaSqaaiaadIgaaeqaaaGccaGL7bGaayzFaa aaaa@4B0E@ pour h = 2 , 3 , , H 1 ; MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWGObGaeyypa0JaaGOmaiaacYcaca aMe8UaaG4maiaacYcacaaMe8UaeSOjGSKaaiilaiaaysW7caWGibGa eyOeI0IaaGymaiaacUdaaaa@4034@
  3. U H = { i U | b H 1 < x i } . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWGvbWaaSbaaSqaaiaadIeaaeqaaO Gaeyypa0ZaaiWaaeaacaaMi8UaamyAaiabgIGiopaaeiaabaGaamyv aiaaykW7aiaawIa7aiaaykW7caWGIbWaaSbaaSqaaiaadIeacqGHsi slcaaIXaaabeaakiabgYda8iaadIhadaWgaaWcbaGaamyAaaqabaaa kiaawUhacaGL9baacaGGUaaaaa@47C1@

Le problème de stratification se ramène à une détermination des points de démarcation, c’est-à-dire des bornes de strate b 1 < b 2 < < b h < < b H 1 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWGIbWaaSbaaSqaaiaaigdaaeqaaO GaeyipaWJaamOyamaaBaaaleaacaaIYaaabeaakiabgYda8iablAci ljabgYda8iaadkgadaWgaaWcbaGaamiAaaqabaGccqGH8aapcqWIMa YscqGH8aapcaWGIbWaaSbaaSqaaiaadIeacqGHsislcaaIXaaabeaa aaa@4256@ avec minimisation de la variance (ou du CV d’une manière équivalente) de l’estimateur de Y ^ EASS MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaaceWGzbGbaKaadaWgaaWcbaGaaeyrai aabgeacaqGtbGaae4uaaqabaaaaa@360D@ total. Dans cette section, nous considérons que le nombre total de strates H MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWGibaaaa@3288@ est défini avant toute application des méthodes de stratification optimale examinées.

Dans la pratique, nous ne disposons pas des valeurs de la variable d’enquête y MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWG5baaaa@32B9@ et, par conséquent, la variance n’est pas calculable dans l’expression (2.3). Une méthode courante consiste à minimiser plutôt la variance (ou le CV) de l’estimateur X ^ EASS MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaaceWGybGbaKaadaWgaaWcbaGaaeyrai aabgeacaqGtbGaae4uaaqabaaaaa@360C@ pour le total de la variable de stratification x . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWG4bGaaiOlaaaa@336A@ Un certain nombre d’auteurs ont conçu des méthodes qui s’attachent à ce problème d’optimisation que nous appellerons désormais « problème de stratification unidimensionnelle ». Nous adoptons la même orientation ici.

Trouver les bornes qui minimisent la variance (2.6) ou le CV (2.7) représente un problème difficile tant en analyse qu’en calcul, et ce, parce que les tailles de population et d’échantillon en nombres entiers ( N h MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaGGOaGaamOtamaaBaaaleaacaWGOb aabeaaaaa@3453@ et n h MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWGUbWaaSbaaSqaaiaadIgaaeqaaa aa@33C7@ respectivement) dépendent non linéairement des bornes des strates. D’après de Moura Brito, Ochi, Montenegro et Maculan (2010a), le nombre de possibilités pour les bornes peut être trés large, car dépendent de N , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWGobGaaiilaaaa@333E@ H MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWGibaaaa@3288@ et du nombre de valeurs distinctes x MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWG4baaaa@32B8@ dans la population.

Vu cette difficulté, on a conçu diverses méthodes dans les dernières décennies pour trouver des bornes optimales de strate, le but étant de dégager au moins des solutions correspondant à des minima locaux de bonne qualité.

Dalenius (1951) s’est attaqué au problème dans le cas H = 2 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWGibGaeyypa0JaaGOmaaaa@344A@ en approchant la variance en (2.6) sans tenir compte de la correction de population finie, ce qui équivaut à supposer que l’échantillonnage intrastrate aurait été un échantillonnage aléatoire simple avec remise. La variance approximative à minimiser est alors donnée par :

Var ( X ^ EASS ) h = 1 H N h 2 S h x 2 / n h . ( 3.1 ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaqGwbGaaeyyaiaabkhadaqadaqaai qadIfagaqcamaaBaaaleaacaqGfbGaaeyqaiaabofacaqGtbaabeaa aOGaayjkaiaawMcaaiabgwKianaaqadabaWaaSGbaeaacaWGobWaa0 baaSqaaiaadIgaaeaacaaIYaaaaOGaam4uamaaDaaaleaacaWGObGa amiEaaqaaiaaikdaaaaakeaacaWGUbWaaSbaaSqaaiaadIgaaeqaaa aaaeaacaWGObGaeyypa0JaaGymaaqaaiaadIeaa0GaeyyeIuoakiaa c6cacaaMf8UaaGzbVlaaywW7caaMf8UaaGzbVlaacIcacaaIZaGaai OlaiaaigdacaGGPaaaaa@5584@

Dans une répartition de Neyman (Cochran, 1977) par la variable x MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWG4baaaa@32B8@ et avec remplacement des tailles d’échantillon n h MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWGUbWaaSbaaSqaaiaadIgaaeqaaa aa@33C7@ en (3.1) par leurs valeurs théoriques n h = N h S h x / k = 1 H N k S k x , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWGUbWaaSbaaSqaaiaadIgaaeqaaO Gaeyypa0ZaaSGbaeaacaWGobWaaSbaaSqaaiaadIgaaeqaaOGaam4u amaaBaaaleaacaWGObGaamiEaaqabaaakeaadaaeWaqaaiaad6eada WgaaWcbaGaam4AaaqabaGccaWGtbWaaSbaaSqaaiaadUgacaWG4baa beaaaeaacaWGRbGaeyypa0JaaGymaaqaaiaadIeaa0GaeyyeIuoaaa GccaGGSaaaaa@44F4@ on obtient l’expression employée par Dalenius (1951) :

Var ( X ^ EASS ) ( h = 1 H N h S h x ) 2 / n . ( 3.2 ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaqGwbGaaeyyaiaabkhadaqadaqaai qadIfagaqcamaaBaaaleaacaqGfbGaaeyqaiaabofacaqGtbaabeaa aOGaayjkaiaawMcaaiabgwKianaalyaabaWaaeWaaeaadaaeWaqaai aad6eadaWgaaWcbaGaamiAaaqabaGccaWGtbWaaSbaaSqaaiaadIga caWG4baabeaaaeaacaWGObGaeyypa0JaaGymaaqaaiaadIeaa0Gaey yeIuoaaOGaayjkaiaawMcaamaaCaaaleqabaGaaGOmaaaaaOqaaiaa d6gaaaGaaiOlaiaaywW7caaMf8UaaGzbVlaaywW7caaMf8Uaaiikai aaiodacaGGUaGaaGOmaiaacMcaaaa@5564@

Dalenius et Hodges (1959) ont regardé le cas H > 2 , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWGibGaeyOpa4JaaGOmaiaacYcaaa a@34FC@ et offert une solution analytique consistant à approcher la distribution de la variable x MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWG4baaaa@32B8@ par son histogramme comportant un nombre modéré de classes. En prenant toujours la variance approximative et en posant une répartition de Neyman, Ekman (1959) a proposé une solution avec une approche géométrique pour trouver les bornes de strate. Hedlin (2000) a élargi la solution d’Ekman en retenant la variance initiale (2.6) comme la fonction à minimiser, ce qu’il a appelé la règle élargie d’Ekman.

Hidiroglou (1986) a avancé une approche qui spécifie d’avance la précision recherchée (CV) de l’estimateur du total et qui divise la population en deux strates ( H = 2 ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaadaqadaqaaiaadIeacqGH9aqpcaaIYa aacaGLOaGaayzkaaaaaa@35D3@ de sorte que la taille totale de l’échantillon n MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWGUbaaaa@32AE@ soit minimisée. Dans cette étude, la seconde strate est à tirage complet ou « à certitude », tous les éléments étant compris dans l’échantillon avec l’unité comme probabilité ( n 2 = N 2 ) . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaadaqadaqaaiaad6gadaWgaaWcbaGaaG OmaaqabaGccqGH9aqpcaWGobWaaSbaaSqaaiaaikdaaeqaaaGccaGL OaGaayzkaaGaaiOlaaaa@38A6@ Lavallée et Hidiroglou (1988) ont généralisé cette méthode au cas H > 2 , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWGibGaeyOpa4JaaGOmaiaacYcaaa a@34FC@ tout en conservant l’idée que la strate contenant le plus grand nombre d’unités de population doive être à échantillonnage complet. Ils adoptaient dans cette optique une répartition spéciale dite de puissance (Bankier, 1988). Plus récemment, Rivest (2002) a encore généralisé la méthode de Lavallée et Hidiroglou (1988) en considérant que le but est de minimiser la variance de l’estimateur d’un total pour une prévision de modélisation de la variable d’enquête y MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWG5baaaa@32B9@ au lieu de la variable de stratification x . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWG4bGaaiOlaaaa@336A@

Gunning et Horgan (2004) ont proposé ce qu’on appelle la méthode géométrique de définition des bornes de strate. Dans cette méthode, on pose que les CV de la variable de stratification x MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaebbnrfifHhDYfgasaacH8rrps0l bbf9q8WrFfeuY=Hhbbf9y8WrFj0xc9vqFj0db9qqvqFr0dXdHiVc=b YP0xH8peeu0xXdcrpe0db9Wqpepec9ar=xfr=xfr=tmeaabaqaciGa caGaaeqabaqaaeaadaaakeaacaWG4baaaa@32B8@ sont approximativement constants et que la distribution de la variable de stratification est approximativement uniforme dans chaque strate. Selon ces hypothèses, l’optimum des bornes de strate formerait une progression géométrique, menant de la sorte à une solution analytique très simple.

Keskintürk et Er (2007) ont proposé une technique d’optimisation globale relevant de ce qu’on appelle les algorithmes génétiques. Dans le même ordre d’idées, de Moura Brito et coll. (2017b) ont appliqué une autre technique d’optimisation globale appelée GRASP au problème de stratification. Dans notre propos, nous avons pris le même chemin que Keskintürk et Er (2007), mais en opérant un choix efficace d’algorithme génétique appelé algorithme génétique biaisé à clés aléatoires (BRKGA) que nous décrivons à la section 4.

Kozak (2004) a proposé une méthode dite de recherche aléatoire reprise par Kozak et Verma (2006), celle-ci étant alors comparée à la méthode géométrique de Gunning et Horgan (2004). Khan, Nand et Ahmad (2008) ont exploité les idées de la programmation dynamique pour concevoir un algorithme qui détermine les bornes de strate en considérant que la variable de stratification est en distribution triangulaire ou normale et que l’échantillonnage intrastrate est avec remise. De Moura Brito, Maculan, Lila et Montenegro (2010b) ont proposé un algorithme exact reposant sur la théorie des graphes et où on pose une répartition proportionnelle entre les strates.

Er (2011) a fait une comparaison d’efficacité entre des méthodes figurant dans la documentation spécialisée en prenant comme solution initiale la méthode géométrique de Gunning et Horgan (2004). Kozak (2014) a comparé sa technique de recherche aléatoire à l’algorithme génétique proposé par Keskintürk et Er (2007). Rao, Khan et Reddy (2014) ont mis au point une méthode qui traite simultanément les problèmes de détermination des bornes de strate et de répartition entre les strates. Leur algorithme repose sur l’hypothèse selon laquelle la variable de stratification suit une distribution de Pareto. Notre optique est plus générale, et nous ne supposons pas que la variable de taille obéit à une distribution en particulier.


Date de modification :