Élaboration d’un système d’estimation sur petits domaines à Statistique Canada
Section 2. Notation de base et contexte
Nous présentons d’abord une notation qui définira les divers estimateurs sur petits domaines inclus dans le système de production. Supposons que représente une population de taille Cette population est fractionnée en domaines mutuellement exclusifs et exhaustifs, où chaque domaine a observations. Un échantillon, de taille provient de la population à l’aide d’un mécanisme de probabilité bien défini et l’échantillon ainsi obtenu est divisé en domaines Il convient de souligner que, pour certains domaines, la taille d’échantillon réalisé peut être de zéro. L’ensemble de domaines, où est strictement supérieur à 0, est représentée par L’ensemble des autres domaines, où est égal à 0, est représenté par
Supposons que représente les probabilités d’inclusion où désigne la sommation de tous les échantillons qui renferment l’unité Nous représentons le poids d’échantillonnage de l’unité par où Le poids final associé à l’unité est représenté par Ce poids est habituellement le produit du poids déterminé par le plan d’échantillonnage original multiplié par un facteur d’ajustement qui représente l’intégration des données auxiliaires disponibles (à l’aide de la régression ou du calage), ainsi que des ajustements pour la non-réponse. À noter que les données auxiliaires utilisées dans le facteur d’ajustement ne sont peut-être pas identiques à celles qui sont employés dans l’estimation sur petits domaines.
L’objectif d’un système d’estimation sur petits domaines est d’estimer un paramètre de population (par exemple une moyenne ou un total) pour chaque domaine d’une variable d’intérêt donnée lorsque la taille de l’échantillon de certains domaines est trop petite pour qu’on puisse avoir recours à des procédures d’estimation directe. Un estimateur direct de est un estimateur qui utilise les valeurs de la variable d’intérêt, uniquement dans les unités d’échantillon du domaine Toutefois, un inconvénient important de ce genre d’estimateurs est qu’ils peuvent produire des erreurs-types inacceptablement grandes, surtout si la taille d’échantillon dans le domaine est petite. Les procédures sur petits domaines utilisent des estimateurs indirects qui se renforcent entre les domaines, en se servant de modèles qui relient tous les domaines grâce à certains paramètres communs. Les estimateurs indirects sont efficaces (c’est-à-dire ils augmentent la taille réelle de l’échantillon et diminuent ainsi l’erreur-type) si le modèle vaut pour chaque domaine. Les écarts par rapport au modèle réduisent la précision. Il existe une grande variété d’estimateurs indirects et un bon résumé est fourni dans Rao et Molina (2015).
Les estimateurs sur petits domaines sont classés au niveau du domaine ou de l’unité selon le niveau auquel la modélisation est réalisée. Les estimateurs sur petits domaines au niveau du domaine sont fondés sur des modèles qui établissent un lien entre un paramètre d’intérêt donné et des variables auxiliaires propres au domaine. Les estimateurs sur petits domaines au niveau de l’unité reposent sur des modèles qui établissent un lien entre la variable d’intérêt et les variables auxiliaires propres à l’unité. Les estimateurs sur petits domaines au niveau du domaine sont calculés si les données sur le domaine au niveau de l’unité ne sont pas disponibles. Ils peuvent également être calculés si les données au niveau de l’unité sont disponibles quand elles sont regroupées au niveau du domaine approprié. Cela pourrait être utile en pratique parce que les estimateurs sur petits domaines au niveau du domaine peuvent être moins susceptibles de donner des valeurs aberrantes que leurs homologues au niveau de l’unité.
- Date de modification :