5. Quelques simulations

Phillip S. Kott et Dan Liao

Précédent | Suivant

Comme dans Kott et Liao (2012), nous avons créé une population synthétique, U , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWGvbGaai ilaaaa@39EF@  d’hôpitaux à partir du fichier de données à grande diffusion DAWN de 2008. Après avoir créé U , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWGvbGaai ilaaaa@39EF@  nous avons tiré indépendamment 3 600 échantillons aléatoires simples stratifiés de taille 400 de U MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWGvbaaaa@393F@  en utilisant les définitions des strates du fichier de données à grande diffusion. Ces définitions incorporent l’information sur l’emplacement et la propriété de l’hôpital (publique ou privée) qui n’est pas fournie directement dans le fichier.

Nous avons fixé les tailles des échantillons de strate de façon qu’elles soient approximativement proportionnelles à une mesure de taille q k , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWGXbWaaS baaSqaaiaadUgaaeqaaOGaaiilaaaa@3B31@  mais jamais inférieures à quatre. Pour q k , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWGXbWaaS baaSqaaiaadUgaaeqaaOGaaiilaaaa@3B31@  nous avons utilisé le nombre annuel de visites au service d’urgence associées à la consommation de drogues, qui était toujours positif. Dans le fichier DAWN, une variable de taille est en fait associée à chaque hôpital figurant dans la base de sondage, à savoir le nombre de visites au service d’urgence durant une année antérieure selon l’American Hospital Association. Malheureusement, cette variable n’était pas incluse dans le fichier de données à grande diffusion. Dans nos simulations, les poids de sondage variaient entre 4,375 et 48, ce qui nous a permis de traiter les facteurs de correction pour population finie comme étant ignorables dans l’estimation de la variance.

Comme dans notre article original, nous avons généré un échantillon de répondants R MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWGsbaaaa@393C@  pour chaque échantillon simulé selon un tirage de Bernoulli à partir de la fonction logistique :

p k = ( 1 + exp ( 3,735 0,4 log ( q k ) ) ) 1 , ( 5.1 ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWGWbWaaS baaSqaaiaadUgaaeqaaOGaeyypa0ZaaeWabeaacaaIXaGaey4kaSIa ciyzaiaacIhacaGGWbWaaeWabeaacaqGZaGaaeilaiaabEdacaqGZa GaaeynaiabgkHiTiaabcdacaqGSaGaaeinaiGacYgacaGGVbGaai4z amaabmqabaGaamyCamaaBaaaleaacaWGRbaabeaaaOGaayjkaiaawM caaaGaayjkaiaawMcaaaGaayjkaiaawMcaamaaCaaaleqabaGaeyOe I0IaaGymaaaakiaacYcacaaMf8UaaGzbVlaaywW7caaMf8UaaGzbVl aacIcacaaI1aGaaiOlaiaaigdacaGGPaaaaa@5DF4@

Nous avons également créé des échantillons de répondants de rechange en utilisant

p k = ( 1 + exp ( 0,597 0,005 q k 1 / 2 ) ) 1 . ( 5.2 ) MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWGWbWaaS baaSqaaiaadUgaaeqaaOGaeyypa0ZaaeWabeaacaaIXaGaey4kaSIa ciyzaiaacIhacaGGWbWaaeWabeaacaqGWaGaaeilaiaabwdacaqG5a Gaae4naiabgkHiTiaabcdacaqGSaGaaeimaiaabcdacaqG1aGaamyC amaaDaaaleaacaWGRbaabaWaaSGbaeaacaaIXaaabaGaaGOmaaaaaa aakiaawIcacaGLPaaaaiaawIcacaGLPaaadaahaaWcbeqaaiabgkHi TiaaigdaaaGccaGGUaGaaGzbVlaaywW7caaMf8UaaGzbVlaaywW7ca GGOaGaaGynaiaac6cacaaIYaGaaiykaaaa@5C95@

Les modèles de réponse ont tous deux produit des taux de réponse globaux non pondérés d’environ 54 %, ce qui est similaire à la situation réelle du fichier DAWN, où la réponse prend aussi la forme d’une fonction légèrement croissante de la variable de taille. Notons que α k = 1 / p k MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacqaHXoqyda WgaaWcbaGaam4AaaqabaGccqGH9aqpdaWcgaqaaiaaigdaaeaacaWG WbWaaSbaaSqaaiaadUgaaeqaaaaaaaa@3F12@  est borné même si ni l’une ni l’autre probabilité ne peut être exprimée par l’équation (2.4) avec une borne supérieure u MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWG1baaaa@395F@  finie.

Comme dans l’étude précédente, nous nous sommes concentrés sur l’estimation des totaux de population pour trois variables étudiées. Les nombres annuels de visites au service d’urgence liées à la consommation de drogues avec réaction pharmaceutique indésirable et de celles résultant en un décès ont été extraits du fichier de données à grande diffusion. Puisque ces variables étaient approximativement linéaires en notre mesure de taille, la troisième variable «étudiée » a été construite artificiellement. Il s’agissait de la mesure de taille (nombre de visites annuelles au service d’urgence liées à la consommation de drogues) élevée à la puissance 1,3.

Nous avons étudié huit estimateurs et estimations de leur variance. Les résultats sont résumés au tableau 5.1. Les deux premiers comportaient le calage sur l’échantillon original seulement (équation (2.5) avec θ = 1 ) , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacqaH4oqCcq GH9aqpcaaIXaGaaiykaiaacYcaaaa@3D39@  en supposant que la réponse était de forme logistique en le logarithme de la mesure de taille. Nous avons employé l’équation (2.3) avec x k = ( log ( q k ) ) T . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWH4bWaaS baaSqaaiaadUgaaeqaaOGaeyypa0ZaaeWabeaacaqGXaGaaeiiaiGa cYgacaGGVbGaai4zamaabmqabaGaamyCamaaBaaaleaacaWGRbaabe aaaOGaayjkaiaawMcaaaGaayjkaiaawMcaamaaCaaaleqabaGaamiv aaaakiaac6caaaa@46AB@  Le premier estimateur utilisait z k = ( log ( q k ) ) T MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWH6bWaaS baaSqaaiaadUgaaeqaaOGaeyypa0ZaaeWabeaacaqGXaGaaeiiaiGa cYgacaGGVbGaai4zamaabmqabaGaamyCamaaBaaaleaacaWGRbaabe aaaOGaayjkaiaawMcaaaGaayjkaiaawMcaamaaCaaaleqabaGaamiv aaaaaaa@45F0@  comme vecteur de calage, tandis que le deuxième utilisait z k = ( q k ) T , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWH6bWaaS baaSqaaiaadUgaaeqaaOGaeyypa0ZaaeWabeaacaqGXaGaaeiiaiaa dghadaWgaaWcbaGaam4AaaqabaaakiaawIcacaGLPaaadaahaaWcbe qaaiaadsfaaaGccaGGSaaaaa@4251@  qui était davantage en harmonie avec un modèle de prédiction raisonnable, du moins pour les réactions indésirables et les décès.

Nos troisième et quatrième estimateurs comportaient le calage sur l’échantillon et sur la population en une seule étape (équation (2.5) avec θ = 1 , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacqaH4oqCcq GH9aqpcaaIXaGaaiilaaaa@3C8C@  puis θ = 0 ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacqaH4oqCcq GH9aqpcaaIWaGaaiykaaaa@3C88@  en utilisant x k = z k = ( l o g ( q k ) q k ) T . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWH4bWaaS baaSqaaiaadUgaaeqaaOGaeyypa0JaaCOEamaaBaaaleaacaWGRbaa beaakiabg2da9maabmqabaGaaeymaiaabccacaGGSbGaai4BaiaacE gadaqadeqaaiaadghadaWgaaWcbaGaam4AaaqabaaakiaawIcacaGL PaaacaWGXbWaaSbaaSqaaiaadUgaaeqaaaGccaGLOaGaayzkaaWaaW baaSqabeaacaWGubaaaOGaaiOlaaaa@4BF4@  Ils étaient conçus pour être quasiment sans biais si le modèle de réponse logistique en ( log ( q k ) ) T MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaadaqadeqaai aabgdacaqGGaGaciiBaiaac+gacaGGNbWaaeWabeaacaWGXbWaaSba aSqaaiaadUgaaeqaaaGccaGLOaGaayzkaaaacaGLOaGaayzkaaWaaW baaSqabeaacaWGubaaaaaa@42C1@  ou le modèle de prédiction linéaire en ( q k ) T MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaadaqadeqaai aabgdacaqGGaGaamyCamaaBaaaleaacaWGRbaabeaaaOGaayjkaiaa wMcaamaaCaaaleqabaGaamivaaaaaaa@3E67@  étaient vérifiés.

Il n’est pas surprenant de constater que l’erreur quadratique moyenne relative (empirique) du quatrième estimateur est toujours plus faible que celle du troisième. La raison en est assez évidente si l’on examine l’équation (3.1) et que l’on considère la conséquence du fait que θ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacqaH4oqCaa a@3A1B@  est égal à 0 (calage sur la population) plutôt qu’à 1 (calage sur l’échantillon).

Les cinquième à huitième estimateurs ont été calés en deux étapes. Pour les cinquième et septième estimateurs, on a employé la pondération par calage utilisée pour le premier estimateur à la première étape, tandis que pour les sixième et huitième, on a employé la pondération par calage du deuxième estimateur. Pour les cinquième et sixième estimateurs, on a utilisé z 2 k = x 2 k = ( log ( q k ) q k ) T MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWH6bWaaS baaSqaaiaaikdacaWGRbaabeaakiabg2da9iaahIhadaWgaaWcbaGa aGOmaiaadUgaaeqaaOGaeyypa0ZaaeWabeaacaqGXaGaaeiiaiGacY gacaGGVbGaai4zamaabmqabaGaamyCamaaBaaaleaacaWGRbaabeaa aOGaayjkaiaawMcaaiaadghadaWgaaWcbaGaam4AaaqabaaakiaawI cacaGLPaaadaahaaWcbeqaaiaadsfaaaaaaa@4CB2@  à la deuxième étape, tandis que les septième et huitième étaient quasi pseudo-optimaux (Kott 2011) en utilisant z 2 k = ( log ( q k ) q k ) T MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWH6bWaaS baaSqaaiaaikdacaWGRbaabeaakiabg2da9maabmqabaGaaeymaiaa bccaciGGSbGaai4BaiaacEgadaqadeqaaiaadghadaWgaaWcbaGaam 4AaaqabaaakiaawIcacaGLPaaacaWGXbWaaSbaaSqaaiaadUgaaeqa aaGccaGLOaGaayzkaaWaaWbaaSqabeaacaWGubaaaaaa@48C9@  et x 2 k = ( d k α k 1 ) z 2 k MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWH4bWaaS baaSqaaiaaikdacaWGRbaabeaakiabg2da9maabmqabaGaamizamaa BaaaleaacaWGRbaabeaakiabeg7aHnaaBaaaleaacaWGRbaabeaaki abgkHiTiaaigdaaiaawIcacaGLPaaacaWH6bWaaSbaaSqaaiaaikda caWGRbaabeaaaaa@472F@  à la deuxième étape. Pour les quatre estimateurs, on a employé les fonctions d’ajustement des poids individuels suivantes :

h k ( g 2 T x 2 k ) = 1 d k α k + ( 1 1 d k α k ) exp [ g 2 T x 2 k 1 1 d k α k ] . MathType@MTEF@5@5@+= feaagKart1ev2aaatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWGObWaaS baaSqaaiaadUgaaeqaaOWaaeWabeaacaWHNbWaa0baaSqaaiaaikda aeaacaWGubaaaOGaaCiEamaaBaaaleaacaaIYaGaam4Aaaqabaaaki aawIcacaGLPaaacqGH9aqpdaWcaaqaaiaaigdaaeaacaWGKbWaaSba aSqaaiaadUgaaeqaaOGaeqySde2aaSbaaSqaaiaadUgaaeqaaaaaki abgUcaRmaabmaabaGaaGymaiabgkHiTmaalaaabaGaaGymaaqaaiaa dsgadaWgaaWcbaGaam4AaaqabaGccqaHXoqydaWgaaWcbaGaam4Aaa qabaaaaaGccaGLOaGaayzkaaGaciyzaiaacIhacaGGWbWaamWabeaa daWcaaqaaiaahEgadaqhaaWcbaGaaGOmaaqaaiaadsfaaaGccaWH4b WaaSbaaSqaaiaaikdacaWGRbaabeaaaOqaaiaaigdacqGHsisldaWc aaqaaiaaigdaaeaacaWGKbWaaSbaaSqaaiaadUgaaeqaaOGaeqySde 2aaSbaaSqaaiaadUgaaeqaaaaaaaaakiaawUfacaGLDbaacaGGUaaa aa@646D@

Comme l’a montré Kott (2011), ces h k ( g 2 T x 2 k ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWGObWaaS baaSqaaiaadUgaaeqaaOWaaeWabeaacaWHNbWaa0baaSqaaiaaikda aeaacaWGubaaaOGaaCiEamaaBaaaleaacaaIYaGaam4Aaaqabaaaki aawIcacaGLPaaaaaa@41A1@  sont asymptotiquement identiques à la fonction d’ajustement des poids, 1 + g 2 T x 2 k , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaaIXaGaey 4kaSIaaC4zamaaDaaaleaacaaIYaaabaGaamivaaaakiaahIhadaWg aaWcbaGaaGOmaiaadUgaaeqaaOGaaiilaaaa@4051@  quand g 2 T x 2 k = O P ( 1 / n ) , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWHNbWaa0 baaSqaaiaaikdaaeaacaWGubaaaOGaaCiEamaaBaaaleaacaaIYaGa am4AaaqabaGccqGH9aqpcaqGpbWaaSbaaSqaaiaadcfaaeqaaOWaae WabeaadaWcgaqaaiaaigdaaeaadaGcaaqaaiaad6gaaSqabaaaaaGc caGLOaGaayzkaaGaaiilaaaa@450A@  mais empêchent tout poids w k MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWG3bWaaS baaSqaaiaadUgaaeqaaaaa@3A7D@  de devenir inférieur à l’unité. Chacune est une version de l’équation (4.1) avec k = 1 / ( d k α k ) , c = 1 , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacqWItecBda WgaaWcbaGaam4AaaqabaGccqGH9aqpdaWcgaqaaiaaigdaaeaadaqa deqaaiaadsgadaWgaaWcbaGaam4AaaqabaGccqaHXoqydaWgaaWcba Gaam4AaaqabaaakiaawIcacaGLPaaaaaGaaiilaiaadogacqGH9aqp caaIXaGaaiilaaaa@46FA@  et u = . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWG1bGaey ypa0JaeyOhIuQaaiOlaaaa@3C88@

Comme le taux de non-réponse n’était pas élevé, nous n’avons pas eu de problème à calculer les troisième et quatrième estimateurs quel qu’était l’échantillon de répondants simulés utilisé. L’erreur quadratique moyenne relative du quatrième estimateur était systématiquement légèrement plus grande que celle des septième et huitième estimateurs, dans lesquels était incorporé un calage quasi pseudo-optimal à la deuxième étape. Curieusement, cela n’était pas le cas pour la comparaison du quatrième estimateur aux cinquième et sixième estimateurs qui, bien que comprenant les deux étapes, n’intégraient pas le calage quasi pseudo-optimal.

Il convient de souligner que, même si le deuxième estimateur possédait systématiquement une plus petite erreur quadratique moyenne relative que le premier, du fait qu’il était davantage en harmonie avec un modèle de prédiction raisonnable (même pour q k 1,3 , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWGXbWaa0 baaSqaaiaadUgaaeaacaqGXaGaaeilaiaabodaaaGccaGGSaaaaa@3D4B@  la variable étudiée paraissait plus près d’être linéaire en q k MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWGXbWaaS baaSqaaiaadUgaaeqaaaaa@3A77@  qu’en log ( q k ) ) , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaadaqaceqaai GacYgacaGGVbGaai4zamaabmqabaGaamyCamaaBaaaleaacaWGRbaa beaaaOGaayjkaiaawMcaaaGaayzkaaGaaiilaaaa@4054@  les autres paires analogues (cinquième c. sixième et septième c. huitième) ne présentaient aucun schéma évident de supériorité. Cela tient au fait que ce sont les résidus de la deuxième étape qui sont effectivement modélisés dans l’équation (4.4) et non les valeurs de y . MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWG5bGaai Olaaaa@3A15@

La production de la non-réponse au moyen de l’équation (5.2) plutôt que (5.1) ne semble pas avoir beaucoup d’effet sur les résultats, sauf en ce qui concerne les biais relatifs du premier estimateur. Tant pour les réactions indésirables que pour la ( taille ) 1 , 3 , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaadaqadeqaai aabshacaqGHbGaaeyAaiaabYgacaqGSbGaaeyzaaGaayjkaiaawMca amaaCaaaleqabaGaaGymaiaacYcacaaIZaaaaOGaaiilaaaa@428B@  le biais relatif de cet estimateur est supérieur à 40 % de l’erreur quadratique moyenne relative. Il en est vraisemblablement ainsi parce que les deux modèles qui pouvaient être utilisés pour justifier cet estimateur (la réponse est logistique en le logarithme de la mesure de taille et la variable étudiée est linéaire en le logarithme de la mesure de taille) n’ont pas tenu. Il n’est donc pas étonnant, puisque le biais relatif représente une telle part de l’erreur quadratique moyenne relative dans ces deux situations, que v ( t k ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWG2bWaae WabeaacaWG0bWaaSbaaSqaaiaadUgaaeqaaaGccaGLOaGaayzkaaaa aa@3D09@  sous-estime fortement l’erreur quadratique moyenne. Nulle part ailleurs le biais relatif de v ( t k ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaacaWG2bWaae WabeaacaWG0bWaaSbaaSqaaiaadUgaaeqaaaGccaGLOaGaayzkaaaa aa@3D09@  n’est supérieur à 15 %.

Il semble que même notre variable artificielle, ( taille ) 1 , 3 , MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiFu0Je9sqqrpepC0xbbL8F4rqqrpipeea0xe9LqFf0x e9q8qqvqFr0dXdbrVc=b0P0xb9peuD0xXddrpe0=1qpeea0=yrVue9 Fve9Fve8meaabaqaciaacaGaaeqabaWaaeaaeaaakeaadaqadeqaai aabshacaqGHbGaaeyAaiaabYgacaqGSbGaaeyzaaGaayjkaiaawMca amaaCaaaleqabaGaaGymaiaacYcacaaIZaaaaOGaaiilaaaa@428B@  s’approchait suffisamment de la linéarité en la mesure de taille pour que le biais ne soit jamais un problème pour tout autre estimateur que le premier. Le premier estimateur lui-même avait un biais relatif négligeable quand la réponse était un modèle logistique du logarithme de la mesure de taille, comme on le suppose.

Précédent | Suivant

Date de modification :