6. Application empirique
Andrés Gutiérrez, Leonardo Trujillo et
Pedro Luis do Nascimento Silva
Précédent | Suivant
Nous examinons d’abord une approche empirique dans
cette section, au moyen de simulations qui nous permettront d’évaluer certaines
propriétés statistiques comme l’absence de biais et l’efficacité des
estimateurs proposés. D’après la modélisation proposée par Stasny (1987), nous
avons considéré une simulation à deux degrés comme suit :
- Répartition
de toutes les personnes dans la population aux différentes cellules d’un
tableau de contingence. Dans ce premier degré, nous allons définir les
probabilités initiales
et
- Processus
de non-réponse à deux périodes consécutives. Dans ce deuxième degré, nous
allons définir les probabilités initiales
et
.
Au premier degré,
il a fallu présumer certaines conditions (processus non observable) où les
probabilités de classification de groupe ont été établies à une période
et les
probabilités de classification conditionnelle pendant une période
. Ainsi, toutes les personnes dans la population
étaient réputées classées dans une des trois catégories suivantes : E1, E2
et E3. Le vecteur d’état pendant une période
a été donné
par
Ainsi, il y a
une probabilité de classification dans E1 équivalant à 0,9 pour toute personne
dans la population et des probabilités de classification dans E2 et E3
équivalant à 0,05. La matrice de transition de la période
à la période
est donnée par
Nous avons présumé
que la taille de la population était de
et que sa
taille ne changerait pas aux deux périodes d’évaluation. Afin de classer les
personnes aux périodes, nous avons utilisé la fonction R rmultinom (R
Development Core Team 2012). Ainsi, la répartition des flux bruts en fonction
de l’équation (3.2) serait donnée par les valeurs dans le tableau 6.1.
Tableau 6.1
Valeurs prévues selon le modèle
pour les flux bruts de la population pendant deux périodes consécutives
Sommaire du tableau
Le tableau montre les résultats de Valeurs prévues selon le modèle
pour les flux bruts de la population pendant deux périodes consécutives. Les données sont présentées selon Période
(titres de rangée) et Période
(figurant comme en-tête de colonne).
Période
|
Période
|
E1 |
E2 |
E3 |
E1 |
72 000 |
13 500 |
4 500 |
E2 |
1 500 |
3 000 |
500 |
E3 |
500 |
500 |
4 000 |
6.1
Méthodologie
Pour cet
exercice empirique, nous avons considéré simulations par la méthode de
Monte Carlo. Afin de
répartir les personnes entre les répondants et les non-répondants pendant les
deux périodes, nous avons utilisé la fonction rmultinom du langage R. Des
variables dichotomiques
et
ont été créées
au moyen de la fonction Domains de la bibliothèque TeachingSampling (Gutiérrez
2009).
Pour chaque exécution de la simulation, un échantillon
de taille
a été tiré.
Nous avons considéré un échantillonnage aléatoire simple (SI) ainsi qu’un plan
d’échantillonnage complexe donnant des probabilités d’inclusion inégales (
PS). Le comportement des
différents estimateurs proposés sera évalué en fonction de leur biais relatif
et de leur erreur quadratique moyenne relative, donnés par
respectivement. Dans les situations où le vecteur des
probabilités d’inclusion était inégal, la fonction S.piPS dans la bibliothèque
TeachingSampling a été utilisée afin de choisir un échantillon sans
remplacement avec des probabilités d’inclusion proportionnelles à une
caractéristique auxiliaire présumée connue et selon la répartition normale avec
différents paramètres. La méthodologie proposée est comparée à deux autres
estimateurs : un estimateur tenant compte de la forme fonctionnelle du
modèle sans tenir compte du plan d’échantillonnage et un estimateur des flux
bruts ne tenant pas compte du plan d’échantillonnage mais présumant que la
non-réponse est ignorable.
Le premier
estimateur, que nous appelons l’estimateur fondé sur le plan, correspond aux
expressions aux résultats 4.2, 4.3 et 4.4. Le deuxième estimateur, que nous
appellerons estimateur basé sur le modèle, correspond aux expressions au
résultat 5.1, puisque les estimateurs du maximum de vraisemblance ne tiennent
pas compte des poids d’échantillonnage. Enfin, le troisième estimateur, que
nous appelons l’estimateur naïf, projette l'information au niveau de
l'échantillon à la population et est donné par
La
probabilité de réponse pendant la période
a été présumée
comme
La probabilité
de réponse pendant la période
pour les
personnes ayant répondu à la période
a été présumée
Enfin, la
probabilité de non-réponse pendant une période
pour les
personnes n’ayant pas répondu pendant la période
a été présumée
D’après le
modèle
les valeurs
prévues des réponses sont données dans le tableau 6.2.
Tableau 6.2
Valeurs prévues d’après le modèle
pour la réponse aux deux périodes consécutives
Sommaire du tableau
Le tableau montre les résultats de Valeurs prévues d’après le modèle
pour la réponse aux deux périodes consécutives. Les données sont présentées selon Période
(titres de rangée) et Période
(figurant comme en-tête de colonne).
Période
|
Période
|
Réponse |
Non-réponse |
Réponse |
72 000 |
8 000 |
Non-réponse |
6 000 |
14 000 |
En tenant
compte de la dynamique des répondants dans les deux périodes et en présumant
qu’il est possible de recueillir toute l’information sur la population au moyen
d’un recensement, nous obtenons les classifications présentées dans le tableau
6.3 ci-après.
Tableau 6.3
Valeurs prévues d’après le modèle
pour les flux bruts de la population (processus observable) pendant deux périodes consécutives
Sommaire du tableau
Le tableau montre les résultats de Valeurs prévues d’après le modèle
pour les flux bruts de la population (processus observable) pendant deux périodes consécutives. Les données sont présentées selon Période
(titres de rangée) et Période
(figurant comme en-tête de colonne).
Période
|
Période
|
E1 |
E2 |
E3 |
Complément de ligne |
E1 |
51 840 |
9 720 |
3 240 |
7 200 |
E2 |
1 080 |
2 160 |
360 |
400 |
E3 |
360 |
360 |
2 880 |
400 |
Complément de colonne |
4 440 |
1 020 |
540 |
14 000 |
6.2
Résultats
6.2.1 Échantillonnage
aléatoire simple : estimateur fondé
sur le plan et fondé sur le modèle
Dans une
première approche empirique, nous avons considéré un échantillonnage aléatoire
simple sans remise comme plan d’échantillonnage. Ce plan d’échantillonnage
induit des probabilités d’inclusion et des facteurs d’expansion uniformes. Selon
ce scénario, les estimateurs fondés sur le plan et fondés sur le modèle sont
les mêmes. Conformément à ce scénario, l’approche démontre une certaine robustesse
d’après les valeurs des biais relatifs qui peuvent être considérées comme
négligeables. On peut le constater dans les tableaux 6.4, 6.5 et 6.6.
Tableau 6.4
Biais relatifs en pourcentage et erreurs quadratiques moyennes relatives en pourcentage (entre parenthèses) de l’estimateur proposé pour les flux bruts de la population
Sommaire du tableau
Le tableau montre les résultats de Biais relatifs en pourcentage et erreurs quadratiques moyennes relatives en pourcentage (entre parenthèses) de l’estimateur proposé pour les flux bruts de la population. Les données sont présentées selon Période
(titres de rangée) et Période
(figurant comme en-tête de colonne).
Période
|
Période
|
E1 |
E2 |
E3 |
E1 |
0,24 (0,094) |
-0,35 (0,189) |
-0,49 (0,474) |
E2 |
-2,89 (0,158) |
-1,89 (0,221) |
2,00 (0,980) |
E3 |
-0,63 (0,790) |
4,54 (0,822) |
-0,84 (0,569) |
Tableau 6.5
Biais relatifs en pourcentage et erreurs quadratiques moyennes relatives en pourcentage (entre parenthèses) des probabilités de transition
Sommaire du tableau
Le tableau montre les résultats de Biais relatifs en pourcentage et erreurs quadratiques moyennes relatives en pourcentage (entre parenthèses) des probabilités de transition
. Les données sont présentées selon Période
(titres de rangée) et Période
(figurant comme en-tête de colonne).
Période
|
Période
|
E1 |
E2 |
E3 |
E1 |
0,13 (0,284) |
-0,39 (0,537) |
-1,00 (3,225) |
E2 |
1,70 (1,296) |
-2,29 (0,569) |
8,64 (0,347) |
E3 |
-6,6 (3,415) |
2,09 (1,992) |
0,56 (0,158) |
Tableau 6.6
Biais relatifs en pourcentage et erreurs quadratiques moyennes relatives en pourcentage (entre parenthèses) des probabilités de classification initiales
Sommaire du tableau
Le tableau montre les résultats de Biais relatifs en pourcentage et erreurs quadratiques moyennes relatives en pourcentage (entre parenthèses) des probabilités de classification initiales
Période
(figurant comme en-tête de colonne).
Période
|
|
|
|
-0,01 (0,094) |
-1,42 (0,980) |
1,74 (0,790) |
De plus, le biais relatif en pourcentage pour la
probabilité de réponse
était de -0,23
et l’erreur quadratique moyenne relative en pourcentage était de 0,221; pour la
probabilité de réponse
le biais en
pourcentage était de 0,055 et l’erreur quadratique moyenne relative en
pourcentage était de 0,031; pour la probabilité de non-réponse
le biais en
pourcentage était de -0,192 et l’erreur quadratique moyenne relative en
pourcentage était de 0,189. Par ailleurs, le tableau 6.7 montre la valeur
prévue empirique des flux bruts pour l’estimateur proposé, et on peut constater
que les valeurs sont très proches de celles données dans le tableau 6.1.
Tableau 6.7
Valeurs prévues empiriques pour l’estimateur proposé des flux bruts de la population
Sommaire du tableau
Le tableau montre les résultats de Valeurs prévues empiriques pour l’estimateur proposé des flux bruts de la population. Les données sont présentées selon Période (t-1) (titres de rangée) et Période (t)(figurant comme en-tête de colonne).
Période
|
Période
|
E1 |
E2 |
E3 |
E1 |
72 085 |
13 444 |
4 454 |
E2 |
1 504 |
2 889 |
535 |
E3 |
474 |
519 |
4 092 |
6.2.2 Échantillonnage
aléatoire simple : estimateur naïf
Conformément à ce scénario et étant donné que cet
estimateur ne tient pas compte du processus de non-réponse, les valeurs des
biais relatifs ne peuvent pas être considérées comme négligeables. On peut le
constater dans le tableau 6.8.
Tableau 6.8
Biais relatifs en pourcentage et erreurs quadratiques moyennes relatives en pourcentage (entre parenthèses) de l’estimateur naïf pour les flux bruts de la population
Sommaire du tableau
Le tableau montre les résultats de Biais relatifs en pourcentage et erreurs quadratiques moyennes relatives en pourcentage (entre parenthèses) de l’estimateur naïf pour les flux bruts de la population. Les données sont présentées selon Période
(titres de rangée) et Période
(figurant comme en-tête de colonne).
Période
|
Période
|
E1 |
E2 |
E3 |
E1 |
-1,21 (4,4) |
10,2 (60,7) |
8,34 (25,2) |
E2 |
-0,25 (38,8) |
-7,51 (30,9) |
1,33 (12,6) |
E3 |
13,7 (43,3) |
-8,54 (46,1) |
0,92 (6,9) |
Le tableau
6.9 montre les valeurs empiriques prévues pour l’estimateur naïf;
comparativement aux valeurs prévues pour le modèle présenté dans le tableau
6.1, ces valeurs ne sont même pas proches.
Tableau 6.9
Valeurs empiriques prévues pour l’estimateur naïf des flux bruts de la population
Sommaire du tableau
Le tableau montre les résultats de Valeurs empiriques prévues pour l’estimateur naïf des flux bruts de la population. Les données sont présentées selon Période
(titres de rangée) et Période
(figurant comme en-tête de colonne).
Période
|
Période
|
E1 |
E2 |
E3 |
E1 |
54 628 |
760 |
4 507 |
E2 |
1 506 |
2 079 |
1 175 |
E3 |
1 603 |
905 |
32 832 |
6.2.3 Probabilités
d’inclusion inégales : estimateur
fondé sur le plan
Dans un troisième scénario, nous avons considéré un
plan d’échantillonnage qui induit des probabilités d’inclusion et des
facteurs d’expansion inégaux. D’après ce scénario, les estimateurs proposés demeurent
sans biais pour les flux bruts et pour les paramètres du modèle. Les biais
relatifs sont présentés dans les tableaux 6.10, 6.11 et 6.12.
Tableau 6.10
Biais relatifs en pourcentage et erreurs quadratiques moyennes relatives en pourcentage (entre parenthèses) de l’estimateur proposé pour les flux bruts de la population
Sommaire du tableau
Le tableau montre les résultats de Biais relatifs en pourcentage et erreurs quadratiques moyennes relatives en pourcentage (entre parenthèses) de l’estimateur proposé pour les flux bruts de la population. Les données sont présentées selon Période
(titres de rangée) et Période
(figurant comme en-tête de colonne).
Période
|
Période
|
E1 |
E2 |
E3 |
E1 |
-0,09 (0,8) |
0,25 (3,6) |
3,17 (7,9) |
E2 |
0,72 (40,9) |
-1,21 (27,2) |
-4,62 (71,08) |
E3 |
1,76 (20,4) |
-3,19 (22,6) |
-0,73 (7,2) |
Tableau 6.11
Biais relatifs en pourcentage et erreurs quadratiques moyennes relatives en pourcentage (entre parenthèses) des probabilités de transition
Sommaire du tableau
Le tableau montre les résultats de Biais relatifs en pourcentage et erreurs quadratiques moyennes relatives en pourcentage (entre parenthèses) des probabilités de transition
. Les données sont présentées selon Période
(titres de rangée) et Période
(figurant comme en-tête de colonne).
Période
|
Période
|
E1 |
E2 |
E3 |
E1 |
-0,05 (0,7) |
0,115 (3,6) |
0,47 (7,1) |
E2 |
2,39 (36,0) |
-0,13 (18,6) |
-6,40 (69,1) |
E3 |
1,15 (24,9) |
-5,14 (21,7) |
0,49 (3,7) |
Tableau 6.12
Biais relatifs en pourcentage et erreurs quadratiques moyennes relatives en pourcentage (entre parenthèses) des probabilités de classification initiales
Sommaire du tableau
Le tableau montre les résultats de Biais relatifs en pourcentage et erreurs quadratiques moyennes relatives en pourcentage (entre parenthèses) des probabilités de classification initiales
Période (t-1)(figurant comme en-tête de colonne).
Période
|
|
|
|
-0,02 (1,1) |
-0,70 (19,8) |
1,13 (6,9) |
Pour la
probabilité de réponse
, le biais en pourcentage était -0,46 et l’erreur
quadratique moyenne relative en pourcentage était de 0,6; pour la probabilité
de réponse
le biais en
pourcentage était de -0,21 et l’erreur quadratique moyenne relative en pourcentage
était de 0,6; pour la probabilité de non-réponse
le biais en
pourcentage était de 0,99 et l’erreur quadratique moyenne relative en
pourcentage était de 1,8. Par ailleurs, le tableau 6.13 indique les valeurs
prévues empiriques de l’estimateur proposé pour les flux bruts de la
population, et ces valeurs sont très proches des valeurs fournies au tableau
6.1.
Tableau 6.13
Valeurs prévues empiriques de l’estimateur fondé sur le plan pour les flux bruts de la population
Sommaire du tableau
Le tableau montre les résultats de Valeurs prévues empiriques de l’estimateur fondé sur le plan pour les flux bruts de la population. Les données sont présentées selon Période
(titres de rangée) et Période
(figurant comme en-tête de colonne).
Période
|
Période
|
E1 |
E2 |
E3 |
E1 |
71 910 |
13 505 |
4 518 |
E2 |
1 523 |
2 972 |
470 |
E3 |
511 |
479 |
4 062 |
6.2.4 Probabilités d’inclusion inégales : estimateur basé sur le modèle
Un quatrième scénario considère un plan
d’échantillonnage induisant des probabilités d’inclusion et des
facteurs d’expansion inégaux de la même manière que le dernier scénario. Cependant,
nous considérons les estimateurs qui ne tiennent pas compte du plan
d’échantillonnage, mais seulement du modèle
Conformément à
ce scénario, les estimations sont biaisées pour les flux bruts et les
paramètres du modèle, comme on peut le constater compte tenu des biais relatifs
dans les tableaux 6.14, 6.15 et 6.16.
Tableau 6.14
Biais relatifs en pourcentage et erreurs quadratiques moyennes relatives en pourcentage (entre parenthèses) de l’estimateur basé sur un modèle pour les flux bruts de la population
Sommaire du tableau
Le tableau montre les résultats de Biais relatifs en pourcentage et erreurs quadratiques moyennes relatives en pourcentage (entre parenthèses) de l’estimateur basé sur un modèle pour les flux bruts de la population. Les données sont présentées selon Période
(titres de rangée) et Période
(figurant comme en-tête de colonne).
Période
|
Période
|
E1 |
E2 |
E3 |
E1 |
4,7 (6,1) |
4,6 (8,9) |
6,3 (10,5) |
E2 |
-89,0 (126,6) |
-89,5 (125,9) |
-88,4 (126,9) |
E3 |
4,1 (23,8) |
-3,7 (26,67) |
5,3 (10,4) |
Tableau 6.15
Biais relatifs en pourcentage et erreurs quadratiques moyennes relatives en pourcentage (entre parenthèses) des probabilités de transition
Sommaire du tableau
Le tableau montre les résultats de Biais relatifs en pourcentage et erreurs quadratiques moyennes relatives en pourcentage (entre parenthèses) des probabilités de transition
. Les données sont présentées selon Période
(titres de rangée) et Période
(figurant comme en-tête de colonne).
Période
|
Période
|
E1 |
E2 |
E3 |
E1 |
0,03 (0,9) |
-0,71 (4,1) |
1,63 (8,6) |
E2 |
2,77 (35,5) |
-1,50 (19,6) |
0,70 (70,6) |
E3 |
4,00 (20,8) |
-14,6 (20,1) |
1,33 (3,41) |
Tableau 6.16
Biais relatifs en pourcentage et erreurs quadratiques moyennes relatives en pourcentage (entre parenthèses) des probabilités initiales de classification
Sommaire du tableau
Le tableau montre les résultats de Biais relatifs en pourcentage et erreurs quadratiques moyennes relatives en pourcentage (entre parenthèses) des probabilités initiales de classification
Période
(figurant comme en-tête de colonne).
Période
|
|
|
|
4,74 (6,48) |
-89,3 (126,7) |
3,95 (11,9) |
De même, pour
la probabilité de réponse
, le biais relatif en pourcentage était de -0,77 et
l’erreur quadratique moyenne relative était de 1,7; pour la probabilité de réponse
le biais
relatif en pourcentage était de -0,53 et l’erreur quadratique moyenne relative
était de 0,5; pour la probabilité de non-réponse
le biais
relatif en pourcentage était de 0,11 et l’erreur quadratique moyenne relative
était de 1,8. Par ailleurs, le tableau 6.17 montre les valeurs prévues
empiriques pour l’estimateur fondé sur un modèle pour les flux bruts de la
population (sans tenir compte du plan d’échantillonnage) et ces valeurs sont
très loin des valeurs du tableau 6.1, en particulier pour la deuxième
catégorie.
Tableau 6.17
Valeurs prévues empiriques pour l’estimateur basé sur un modèle pour les flux bruts de la population
Sommaire du tableau
Le tableau montre les résultats de Valeurs prévues empiriques pour l’estimateur basé sur un modèle pour les flux bruts de la population. Les données sont présentées selon Période (t-1) (titres de rangée) et Période (t)(figurant comme en-tête de colonne).
Période
|
Période
|
E1 |
E2 |
E3 |
E1 |
75 438 |
14 039 |
4 790 |
E2 |
164 |
315 |
53 |
E3 |
540 |
443 |
4 213 |
6.2.5 Probabilités d’inclusion inégales : estimateur naïf
Dans un
cinquième scénario, nous considérons un plan d’échantillonnage avec des
probabilités d’inclusion et des facteurs d’expansion inégaux. Compte tenu de
l’estimateur naïf, qui ne tient pas compte du plan d’échantillonnage ou du
modèle du répondant, le tableau 6.18 montre le biais relatif pour chaque cas
dans la matrice de flux bruts. Cet estimateur serait recommandable uniquement
si la non-réponse était ignorable et que le plan
d’échantillonnage correspondait à un plan d’échantillonnage aléatoire simple.
Tableau 6.18
Biais relatifs en pourcentage et erreurs quadratiques moyennes relatives en pourcentage (entre parenthèses) pour l’estimateur naïf des flux bruts de la population
Sommaire du tableau
Le tableau montre les résultats de Biais relatifs en pourcentage et erreurs quadratiques moyennes relatives en pourcentage (entre parenthèses) pour l’estimateur naïf des flux bruts de la population. Les données sont présentées selon Période
(titres de rangée) et Période
(figurant comme en-tête de colonne).
Période
|
Période
|
E1 |
E2 |
E3 |
E1 |
-28,1 (34,7) |
-27,6 (60,0) |
-24,5 (41,1) |
E2 |
497,0 (629,2) |
570,2 (610,3) |
432,7 (686,2) |
E3 |
-40,5 (44,2) |
-37,0 (47,4) |
-33,0 (33,8) |
Afin de faire
une comparaison plus exacte, il serait possible de calculer les valeurs prévues
des flux bruts et de les comparer au scénario actuel. Le tableau 6.19 montre
les valeurs prévues empiriques pour l’estimateur naïf; comparativement aux
valeurs prévues pour le modèle données dans le tableau 6.1, ces valeurs ne sont
pas très proches et sont particulièrement médiocres pour les classifications de
la deuxième catégorie.
Tableau 6.19
Valeurs prévues empiriques pour l’estimateur naïf des flux bruts de la population
Sommaire du tableau
Le tableau montre les résultats de Valeurs prévues empiriques pour l’estimateur naïf des flux bruts de la population. Les données sont présentées selon Période
(titres de rangée) et Période
(figurant comme en-tête de colonne).
Période
|
Période
|
E1 |
E2 |
E3 |
E1 |
51 755 |
9 849 |
3 297 |
E2 |
9 194 |
19 838 |
2 823 |
E3 |
279 |
295 |
2 665 |
Précédent | Suivant