5. Estimation par domaine
Takis Merkouris
Précédent | Suivant
Les estimateurs composites pour les domaines
(sous-populations) d'intérêt peuvent être obtenus facilement en utilisant les
poids calés dérivés aux sections précédentes, c'est-à-dire par sommation des
valeurs pondérées d'une variable sur tout domaine
Par exemple, en désignant par
la matrice
pour l'échantillon
en fixant les entrées de la
ligne égale à 0 si
l'estimateur RGC du total de
domaine
basé sur les poids de
calés selon le scénario du plan (c) (voir la section 3)
est donné par
où
et l'indice inférieur
indique le domaine. L'estimateur
RGC
basé sur l'échantillon
s'obtient de la même manière. Cependant,
contrairement à l'estimateur au niveau de la population (3.2) qui résulte du
calage de deux estimateurs l'un sur l'autre au niveau de la population, les
estimateurs
et
ne sont pas construits comme des
composites de deux estimateurs de domaine basés sur les échantillons
et
et ils ne sont pas identiques. De
surcroît, même si
et
incorporent l'information sur
provenant des échantillons
et
leur construction (non
personnalisée au niveau du domaine) peut comporter une certaine perte
d'efficacité.
Une simple modification de la procédure
de calage qui aboutit à une estimation composite efficace pour tous les totaux d'intérêt
comprend l'augmentation de la matrice de plan au moyen de colonnes définies au
niveau de chaque domaine pour les variables pertinentes. Donc, pour le plan (c),
l'estimation du total de domaine
comprend l'augmentation de la
matrice de plan
en (2.7) au moyen de la
colonne
L'estimateur résultant,
peut s'écrire sous la forme
où
et
sont maintenant les estimateurs RG
de domaine incorporant l'effet de régression des deuxième et troisième termes de
(5.1). L'ajout dans (5.1) d'un autre terme comprenant la différence
pourrait ne pas améliorer
appréciablement l'efficacité de
mais sera nécessaire si l'estimation
du total de domaine
est également requise. Dans
toute situation particulière, l'augmentation de la matrice de plan
ne concerne que les composantes de
ou de
pour lesquelles les estimations par
domaine sont nécessaires. Un inconvénient éventuel de cette procédure est le
fardeau de calcul supplémentaire, qui augmente avec le nombre de domaines et de
variables pour lesquels l'estimation par domaine est requise.
Une autre approche, qui pourrait être
plus appropriée quand les estimations par domaine d'intérêt sont nombreuses, consiste
à produire séparément les estimations par domaine en exécutant le calage
composite uniquement au niveau du domaine. Pour le total de domaine
cela donnera l'estimateur RGC
de domaine, par analogie avec l'estimateur RGC de population (3.2),
où
et
L'efficacité de l'estimateur
conjoint
par rapport à l'estimateur
peut être vérifiée sous les conditions
de la proposition suivante (dont la preuve est donnée en annexe).
Proposition 2 Sous les scénarios
d'échantillonnage du théorème 1,
Produire séparément les estimations de
domaine, par calage composite au niveau du domaine, a notamment pour
inconvénient la perte de cohérence entre les estimations au niveau de la population
et au niveau du domaine.
Les considérations qui précèdent
s'étendent à l'estimation par domaine dans le cas du plan d'échantillonnage
matriciel (d).
Précédent | Suivant