Élaboration d’un système d’estimation sur petits domaines à Statistique Canada

Section 2. Notation de base et contexte

Table des matières

Nous présentons d’abord une notation qui définira les divers estimateurs sur petits domaines inclus dans le système de production. Supposons que $U$ représente une population de taille $N .$ Cette population est fractionnée en $M$ domaines mutuellement exclusifs et exhaustifs, où chaque domaine $U_{i} \subset U, i = 1, \dots, M$ a $N_{i}$ observations. Un échantillon, $s,$ de taille $n$ provient de la population à l’aide d’un mécanisme de probabilité $p (s)$ bien défini et l’échantillon ainsi obtenu est divisé en domaines $s_{i} = s \cap U_{i}, i = 1, \dots, M .$ Il convient de souligner que, pour certains domaines, la taille d’échantillon réalisé $n_{i}$ peut être de zéro. L’ensemble de $m (m \leq M)$ domaines, où $n_{i}$ est strictement supérieur à 0, est représentée par $A .$ L’ensemble des autres domaines, où $n_{i}$ est égal à 0, est représenté par $\bar{A} .$

Supposons que $π_{j} = \sum_{{s : j \in s}} p (s), j \in U,$ représente les probabilités d’inclusion où ${s : j \in s}$ désigne la sommation de tous les échantillons $s$ qui renferment l’unité $j .$ Nous représentons le poids d’échantillonnage de l’unité $j$ par $d_{j},$ où $d_{j} = π_{j}^{- 1} .$ Le poids final associé à l’unité $j$ est représenté par $w_{j} .$ Ce poids est habituellement le produit du poids déterminé par le plan d’échantillonnage original $(d_{j})$ multiplié par un facteur d’ajustement qui représente l’intégration des données auxiliaires disponibles (à l’aide de la régression ou du calage), ainsi que des ajustements pour la non-réponse. À noter que les données auxiliaires utilisées dans le facteur d’ajustement ne sont peut-être pas identiques à celles qui sont employés dans l’estimation sur petits domaines.

L’objectif d’un système d’estimation sur petits domaines est d’estimer un paramètre de population $θ_{i}$ (par exemple une moyenne ou un total) pour chaque domaine $i$ d’une variable d’intérêt donnée $y$ lorsque la taille de l’échantillon de certains domaines $n_{i}$ est trop petite pour qu’on puisse avoir recours à des procédures d’estimation directe. Un estimateur direct de $θ_{i}$ est un estimateur qui utilise les valeurs de la variable d’intérêt, $y,$ uniquement dans les unités d’échantillon du domaine $i .$ Toutefois, un inconvénient important de ce genre d’estimateurs est qu’ils peuvent produire des erreurs-types inacceptablement grandes, surtout si la taille d’échantillon dans le domaine est petite. Les procédures sur petits domaines utilisent des estimateurs indirects qui se renforcent entre les domaines, en se servant de modèles qui relient tous les domaines grâce à certains paramètres communs. Les estimateurs indirects sont efficaces (c’est-à-dire ils augmentent la taille réelle de l’échantillon et diminuent ainsi l’erreur-type) si le modèle vaut pour chaque domaine. Les écarts par rapport au modèle réduisent la précision. Il existe une grande variété d’estimateurs indirects et un bon résumé est fourni dans Rao et Molina (2015).

Les estimateurs sur petits domaines sont classés au niveau du domaine ou de l’unité selon le niveau auquel la modélisation est réalisée. Les estimateurs sur petits domaines au niveau du domaine sont fondés sur des modèles qui établissent un lien entre un paramètre d’intérêt donné et des variables auxiliaires propres au domaine. Les estimateurs sur petits domaines au niveau de l’unité reposent sur des modèles qui établissent un lien entre la variable d’intérêt et les variables auxiliaires propres à l’unité. Les estimateurs sur petits domaines au niveau du domaine sont calculés si les données sur le domaine au niveau de l’unité ne sont pas disponibles. Ils peuvent également être calculés si les données au niveau de l’unité sont disponibles quand elles sont regroupées au niveau du domaine approprié. Cela pourrait être utile en pratique parce que les estimateurs sur petits domaines au niveau du domaine peuvent être moins susceptibles de donner des valeurs aberrantes que leurs homologues au niveau de l’unité.

ISSN : 1712-5685

Politique de rédaction

Techniques d’enquête publie des articles sur les divers aspects des méthodes statistiques qui intéressent un organisme statistique comme, par exemple, les problèmes de conception découlant de contraintes d’ordre pratique, l’utilisation de différentes sources de données et de méthodes de collecte, les erreurs dans les enquêtes, l’évaluation des enquêtes, la recherche sur les méthodes d’enquête, l’analyse des séries chronologiques, la désaisonnalisation, les études démographiques, l’intégration de données statistiques, les méthodes d’estimation et d’analyse de données et le développement de systèmes généralisés. Une importance particulière est accordée à l’élaboration et à l’évaluation de méthodes qui ont été utilisées pour la collecte de données ou appliquées à des données réelles. Tous les articles seront soumis à une critique, mais les auteurs demeurent responsables du contenu de leur texte et les opinions émises dans la revue ne sont pas nécessairement celles du comité de rédaction ni de Statistique Canada.

Présentation de textes pour la revue

Techniques d’enquête est publiée en version électronique deux fois l’an. Les auteurs désirant faire paraître un article sont invités à le faire parvenir en français ou en anglais en format électronique et préférablement en Word au rédacteur en chef, (statcan.smj-rte.statcan@canada.ca, Statistique Canada, 150 Promenade du Pré Tunney, Ottawa, (Ontario), Canada, K1A 0T6). Pour les instructions sur le format, veuillez consulter les directives présentées dans la revue ou sur le site web (www.statcan.gc.ca/Techniquesdenquete).

Note de reconnaissance

Le succès du système statistique du Canada repose sur un partenariat bien établi entre Statistique Canada et la population, les entreprises, les administrations canadiennes et les autres organismes. Sans cette collaboration et cette bonne volonté, il serait impossible de produire des statistiques précises et actuelles.

Normes de service à la clientèle

Statistique Canada s'engage à fournir à ses clients des services rapides, fiables et courtois. À cet égard, notre organisme s'est doté de normes de service à la clientèle qui doivent être observées par les employés lorsqu'ils offrent des services à la clientèle.

Droit d'auteur

Publication autorisée par le ministre responsable de Statistique Canada.

L'utilisation de la présente publication est assujettie aux modalités de l'Entente de licence ouverte de Statistique Canada.

N° 12-001-X au catalogue

Périodicité : semi-annuel

Ottawa

Date de modification :: 2019-05-07

Sélection de la langue

Recherche et menus

Recherche

Élaboration d’un système d’estimation sur petits domaines à Statistique Canada

Section 2. Notation de base et contexte

Élaboration d’un système d’estimation sur petits domaines à Statistique Canada Section 2. Notation de base et contexte

Politique de rédaction

Présentation de textes pour la revue

Note de reconnaissance

Normes de service à la clientèle

Droit d'auteur

Élaboration d’un système d’estimation sur petits domaines à Statistique Canada

Section 2. Notation de base et contexte