Mesure de l’incertitude associée aux estimateurs pour petits domaines basés sur un modèle
Section 4. Estimation de l’EQM sous le plan de sondage
À la
présente section, nous commençons par étudier l’estimation de l’EQM sous le
plan, puis nous proposons une estimation composite de l’EQM qui offre un
équilibre entre le biais sous le plan et le coefficient de variation.
4.1 Modèle au niveau
du domaine
Examinons
maintenant l’estimation de l’EQM sous le plan de l’estimateur EB en
traitant les paramètres de petit domaine
comme des paramètres inconnus fixes. Comme il
est mentionné dans l’introduction, les statisticiens d’enquête cherchent
souvent à estimer l’EQM sous le plan des estimateurs EB, pour cadrer avec
les estimateurs classiques de l’EQM sous le plan des estimateurs directs pour
les grands domaines pour lesquels la taille d’échantillon est adéquate. L’EQM
sous le plan est donnée par
où
est le vecteur des moyennes de domaine.
Si nous
exprimons
sous la forme
avec
un estimateur exactement sans biais de l’EQM
sous le plan est donné par
Datta,
Kubokawa, Molina et Rao (2011) donnent une expression explicite pour la dérivée
figurant dans le deuxième terme de (4.1) dans le cas des estimateurs du REML
des paramètres du modèle. L’estimateur (4.1) peut prendre des valeurs
négatives et être très instable en ce qui concerne la racine carrée de l’erreur
quadratique moyenne relative (REQMR), comme le montrent Datta et coll.
(2011). Il s’ensuit que (4.1) n’est pas un estimateur fiable de l’EQM sous le
plan, même s’il est sans biais par rapport au plan. Les résultats de nos
simulations présentés à la section 5 visent à étudier les propriétés
conditionnelles des estimateurs (3.1) et (4.1) de l’EQM dans le cadre de
l’estimation basée sur le plan de sondage.
Certains
éclaircissements théoriques peuvent être obtenus en examinant le cas où les
paramètres du modèle sont connus et en considérant le meilleur estimateur (2.2)
de la moyenne de domaine
Dans ce cas, Rivest et Belmonte (2000) ont
obtenu un estimateur sans biais sous le plan donné par
Notons
que, pour une grande variance d’échantillonnage
nous avons
et (4.2) se réduit à
Il
découle de (4.3) que l’estimateur de l’EQM peut prendre des valeurs négatives
et, en fait, la probabilité d’obtenir une valeur négative est proche de 0,5
quand
est proche de zéro ou que la variance
d’échantillonnage
est grande. Dans ce cas particulier où les
paramètres du modèle sont connus, nous pouvons étudier le biais sous le plan de
l’estimateur sous le modèle de l’EQM de (2.2), donné par
lorsque l’on prend la moyenne sur l’ensemble
des domaines. On peut montrer que le biais moyen sous le plan converge en
probabilité sous le modèle vers zéro quand
(Rao et Molina, 2015, page 287). Ce
résultat donne à penser que l’estimateur de l’EQM sous le modèle devrait avoir
de bonnes propriétés en ce qui concerne le biais moyen sous le plan, à
condition que le modèle présumé soit valide.
L’estimateur
sans biais sous le plan (4.1) n’est pas utilisable en pratique quand il prend
une valeur négative pour l’échantillon pris en considération. Donc, nous
proposons une modification de (4.1) qui mène à un estimateur positif de l’EQM.
Nous désignons l’estimateur de l’EQM modifié par
Il utilise (4.1) quand celui-ci prend une
valeur positive pour l’échantillon pris en considération et remplace (4.1) par
l’estimation de l’EQM sous le modèle (3.1) quand (4.1) prend une valeur
négative. Il est possible d’utiliser une autre estimation positive de l’EQM,
par exemple un estimateur de l’EQM sous le plan positif naïf proposé par
Pfeffermann et Gilboa (2017). Nous n’avons pas étudié cette modification dans
notre étude en simulation.
Nous
proposons maintenant des estimateurs composites de l’EQM sous le plan visant à
offrir un équilibre entre le biais sous le plan et la REQMR. Nous obtenons un
estimateur composite en prenant une moyenne pondérée de l’estimateur de l’EQM
sous le plan (4.1) et de l’estimateur inconditionnel de l’EQM sous le modèle
(3.1) avec les poids
et
respectivement. Cet estimateur composite de
l’EQM peut s’écrire sous la forme
Il
découle de (4.4) que moins de poids est accordé à l’estimateur de l’EQM sous le
plan quand la variance d’échantillonnage est grande, ce qui contrôle la REQMR
de l’estimateur composite de l’EQM. En outre, le biais par rapport au plan de
l’estimateur composite de l’EQM est toujours plus petit que celui de
l’estimateur de l’EQM sous le modèle. Quand la valeur de
(ou de la taille de l’échantillon de domaine)
est très petite, un autre choix des poids pour la construction de l’estimateur
composite consiste à remplacer
par
et
par
dans (4.4). L’estimateur composite de l’EQM
résultant
donne
plus de poids à
que (4.4) et donne donc de meilleurs résultats
en ce qui concerne le biais sous le plan au prix d’une augmentation de l’EQM.
Comme l’estimateur (4.4), l’estimateur composite de l’EQM de rechange (4.5)
possède toujours un biais sous le plan plus petit que l’estimateur de l’EQM
sous le modèle. Les estimateurs (4.4) et (4.5) peuvent aussi prendre tous deux
des valeurs négatives, mais vraisemblablement moins souvent en raison de leur
construction. Pour être certains d’obtenir des estimateurs composites de l’EQM
positifs, nous faisons une modification similaire à
et remplaçons (4.4) et (4.5) par l’estimation
de l’EQM sous le modèle (3.1) quand ils prennent des valeurs négatives pour
l’échantillon pris en considération. Nous désignons les estimateurs modifiés
par
et
respectivement. À la section 5, nous
examinons la performance des deux estimateurs composites de l’EQM modifiés
comparativement à l’estimateur de l’EQM sous le modèle (3.1) et à l’estimateur
de l’EQM sous le plan modifié en ce qui concerne le BRA, la REQMR et le taux de
couverture des intervalles de confiance.
4.2
Modèle au niveau de l’unité
Nous
nous concentrons sur l’échantillonnage aléatoire simple (EAS) sans remise dans
chaque domaine. Même pour ce plan de sondage particulier, on ne trouve dans la
littérature aucune expression analytique pour l’EQM sous le plan de
l’estimateur EB
ni pour son estimateur, contrairement au cas
du modèle au niveau du domaine. Par conséquent, nous proposons une méthode
heuristique qui consiste à évaluer l’EQM sous le plan du meilleur estimateur
donné par (2.6) sous EAS en supposant que tous
les paramètres du modèle sont connus, puis à estimer l’EQM sous le plan.
L’estimateur de l’EQM sans biais sous le plan du meilleur estimateur ainsi
obtenu dépend des paramètres du modèle et nous remplaçons ces derniers par les
estimateurs du REML correspondants. L’estimateur de l’EQM résultant n’est pas
sans biais sous le plan pour l’EQM sous le plan de l’estimateur EB, et il
sous-estime vraisemblablement l’EQM sous le plan réel, parce qu’il n’est pas
tenu compte de la variabilité associée aux paramètres estimés du modèle. Nous
étudions la performance de cet estimateur dans une étude en simulation.
Sous
EAS sans remise dans le domaine
nous avons
où
est la moyenne d’échantillon de domaine et
est la moyenne de population de domaine des
valeurs
Il découle de (4.6) que l’EQM sous le plan du
meilleur estimateur est donnée par
où
en
notant que le terme correspondant au produit croisé est nul sous EAS.
Il
découle maintenant de (4.7) et (4.8) qu’un estimateur de l’EQM sans biais sous
le plan du meilleur estimateur est donné par
où
et
En remplaçant les paramètres du modèle dans
(4.9) par leurs estimateurs du REML, on obtient un estimateur de l’EQM sous le
plan de l’estimateur EB, désigné par
Cet estimateur de l’EQM sous-estime
vraisemblablement l’EQM sous le plan de l’estimateur EB, parce que le
meilleur estimateur (2.6) ne tient pas compte de la variabilité des estimateurs
des paramètres du modèle.
Un estimateur
composite de l’EQM,
s’obtient maintenant en prenant une
combinaison pondérée de
et
de l’estimateur de l’EQM sous le modèle
avec les poids
et
, respectivement. Il est donné par
Molina et Kominiak (2017) ont proposé des
estimateurs bootstrap paramétriques et non paramétriques de l’EQM sous le plan
de
Ils ont également obtenu un estimateur composite
de l’EQM, similaire à(4.10), en utilisant l’estimateur bootstrap non
paramétrique (BNP) de l’EQM et l’estimateur bootstrap paramétrique (BP) de
l’EQM comme composantes de l’estimateur composite de l’EQM associé à
et
respectivement. Comme l’ont fait remarquer ces
auteurs, un inconvénient de cet estimateur composite de l’EQM est qu’il faut exécuter
à la fois la procédure BP et la procédure BNP pour chaque domaine, ce qui
ralentit les calculs. Molina et Kominiak (2017) ont également proposé un
estimateur composite bootstrap paramétrique sous le plan (BPP) de l’EQM.
L’estimateur BPP évite d’exécuter à la fois la procédure BP et la procédure BNP
pour chaque domaine. Les deux estimateurs composites bootstrap de l’EQM ont
donné de bons résultats dans une étude en simulation basée sur le plan de
sondage.
ISSN : 1712-5685
Politique de rédaction
Techniques d’enquête publie des articles sur les divers aspects des méthodes statistiques qui intéressent un organisme statistique comme, par exemple, les problèmes de conception découlant de contraintes d’ordre pratique, l’utilisation de différentes sources de données et de méthodes de collecte, les erreurs dans les enquêtes, l’évaluation des enquêtes, la recherche sur les méthodes d’enquête, l’analyse des séries chronologiques, la désaisonnalisation, les études démographiques, l’intégration de données statistiques, les méthodes d’estimation et d’analyse de données et le développement de systèmes généralisés. Une importance particulière est accordée à l’élaboration et à l’évaluation de méthodes qui ont été utilisées pour la collecte de données ou appliquées à des données réelles. Tous les articles seront soumis à une critique, mais les auteurs demeurent responsables du contenu de leur texte et les opinions émises dans la revue ne sont pas nécessairement celles du comité de rédaction ni de Statistique Canada.
Présentation de textes pour la revue
Techniques d’enquête est publiée en version électronique deux fois l’an. Les auteurs désirant faire paraître un article sont invités à le faire parvenir en français ou en anglais en format électronique et préférablement en Word au rédacteur en chef, (statcan.smj-rte.statcan@canada.ca, Statistique Canada, 150 Promenade du Pré Tunney, Ottawa, (Ontario), Canada, K1A 0T6). Pour les instructions sur le format, veuillez consulter les directives présentées dans la revue ou sur le site web (www.statcan.gc.ca/Techniquesdenquete).
Note de reconnaissance
Le succès du système statistique du Canada repose sur un partenariat bien établi entre Statistique Canada et la population, les entreprises, les administrations canadiennes et les autres organismes. Sans cette collaboration et cette bonne volonté, il serait impossible de produire des statistiques précises et actuelles.
Normes de service à la clientèle
Statistique Canada s'engage à fournir à ses clients des services rapides, fiables et courtois. À cet égard, notre organisme s'est doté de normes de service à la clientèle qui doivent être observées par les employés lorsqu'ils offrent des services à la clientèle.
Droit d'auteur
Publication autorisée par le ministre responsable de Statistique Canada.
© Sa Majesté la Reine du chef du Canada, représentée par le ministre de l’Industrie 2018
L'utilisation de la présente publication est assujettie aux modalités de l'Entente de licence ouverte de Statistique Canada.
N° 12-001-X au catalogue
Périodicité : semi-annuel
Ottawa