Publications
Série de documents de recherche sur les dépenses des ménages
Enquête sur les dépenses des ménages de 2004 : Indicateurs de qualité des données
Section 3
Les erreurs de couverture
Consulter la version la plus récente.
Information archivée dans le Web
L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.
Le sous-dénombrement et le surdénombrement : les taux de glissement
L'ajustement au niveau de la population et des ménages
Lors de la conception de l'enquête, on a défini la population visée, qu'on appelle la population cible. Rappelons d'abord la définition de cette population cible pour l'enquête sur les dépenses des ménages (EDM) puisqu'une bonne compréhension de la population cible est nécessaire à une bonne interprétation des données de l'enquête. Il est important de préciser que l'EDM utilise la base de sondage de l'enquête sur la population active (EPA).
La population cible
La population cible correspond aux individus vivant dans les ménages privés. Les pensionnaires d'établissement institutionnel tel que les prisons, les hôpitaux pour malades chroniques, les résidences pour personnes âgées ainsi que les membres d'ordres religieux et d'autres groupes vivant en communauté, les membres des Forces Armées vivant dans les camps militaires et les individus vivant de façon permanente dans les hôtels ou les maisons de chambres sont donc exclus. On exclut aussi les représentants officiels de pays étrangers qui vivent au Canada et leurs familles ainsi que les résidents des réserves indiennes et des terres publiques (à l'exception des Territoires). L'enquête couvre donc près de 98 % de la population dans les 10 provinces. Les Territoires sont exclus de la population cible pour l'EDM de 2004, l'enquête ne couvrant cette région qu'une année sur deux.
Nous n'avons pas recueilli de renseignements auprès des personnes qui vivent temporairement loin de leur famille (par exemple, les étudiants d'université) parce que nous obtenons l'information auprès de leur famille, si elle est choisie dans l'échantillon.
Les erreurs de couverture proviennent d'une représentation inadéquate de la population cible à partir des unités de la base de sondage. Certaines unités de la population cible peuvent être omises de la base de sondage, on parle alors d'un sous-dénombrement. D'autres unités qui ne sont pas dans la population cible peuvent être incluses par erreur ou certaines unités peuvent être incluses plus d'une fois, ces unités sont responsables du surdénombrement.
3.1 Le sous-dénombrement et le surdénombrement : les taux de glissement
Dans l'EDM, la sélection de l'échantillon est effectuée en utilisant une liste de logements dans chaque grappe sélectionnée. L'omission de logements lors de la création de la liste, les nouveaux logements qui s'ajoutent entre la création de la liste et la visite des intervieweurs (principalement dans les secteurs en développement) ainsi que la classification erronée de logements vacants contribuent au sous-dénombrement. Le fait d'inclure des logements qui ne seraient pas dans les limites de la grappe est une source de surdénombrement. De façon similaire, des erreurs peuvent se glisser lors de la collecte des données, lors de l'identification des personnes qui sont membres du ménage sélectionné. Ces erreurs contribuent également au sous-dénombrement et au surdénombrement.
De plus, tel que décrit à la section 2.4, des méthodes de repondération sont mises en place pour tenir compte de la non-réponse. Lors de ces ajustements, il est cependant impossible de corriger les poids d'enquête pour faire en sorte que tous les sous-groupes de la population soient bien représentés.
Une bonne représentation de la population cible est indispensable à la production d'estimations de dépenses réalistes. Il est nécessaire que l'échantillon représente adéquatement les individus de la population cible et la distribution des ménages selon leur taille.
On observe généralement un sous-dénombrement net du nombre de personnes et du nombre de ménages dans l'EDM, que l'on rectifie par un ajustement des poids en utilisant des données auxiliaires, ou repères, qui sont basées sur des estimations démographiques post-censitaires. Le taux de glissement (voir annexe A) est une mesure du pourcentage d'écart entre les estimations provenant de ces données auxiliaires et les estimations de l'enquête calculées en utilisant des poids non ajustés avec ces données.1 Le glissement représente donc l'effet cumulé du sous-dénombrement et du débalancement dans certains sous-groupes de la population créé par la non-réponse à l'enquête qui n'a pu être corrigée à l'étape de la repondération.
Pour l'enquête de 2004, plusieurs changements ont été apportés à l'approche visant à ajuster les poids en utilisant des données auxiliaires. D'abord les estimations démographiques post-censitaires proviennent maintenant du Recensement de 2001 et non plus du Recensement de 1996, ce qui rend les taux de glissements de 2004 difficilement comparables à ceux des enquêtes précédentes. De plus, des modifications ont été apportées à la stratégie d'ajustement des poids [6]. Par exemple, dans les enquêtes précédentes les ajustements démographiques étaient effectués au niveau des croisements de neuf groupes d'âge selon le sexe, alors que la nouvelle stratégie se restreint à huit groupes d'âge. Des analyses ont démontré que le sexe ne semble pas être associé aux dépenses des ménages puisque les ménages sont en général constitués de personnes des deux sexes. Les ajustements selon le sexe ne contribuent donc pas à améliorer la qualité des estimations. Il est toutefois clair qu'il existe un effet du sexe sur les dépenses pour les ménages composés d'une seule personne. Par contre, l'absence de statistiques démographiques annuelles sur le nombre de ménages d'une seule personne, ventilé selon le sexe, ne nous permet pas de faire des ajustements pour ce cas particulier.
Taux de glissement par groupe d'âge et sexe à l'échelle nationale
Les taux de glissement par groupe d'âge et sexe à l'échelle nationale sont présentés dans le Tableau 3.1-1. Un taux positif correspond à un surdénombrement du nombre de personnes dans l'enquête.
Tableau 3.1-1 Taux de glissement nationaux selon le groupe d'âge-sexe, Canada
Pour l'EDM de 2004, le taux de sous-dénombrement de la population était de 9,3 %. Les taux de glissement des enfants (0 à 6 ans et 7 à 17 ans) sont très différents de ceux des autres groupes d'âge. En effet, le taux de sous-dénombrement pour l'ensemble des enfants est de 0,1 %, alors qu'il est de 11,9 % pour les adultes (données non présentées). De plus, chez les filles de 0 à 17 ans on observe un léger surdénombrement. Pour les filles de 0 à 6 ans, ceci est dû aux surdénombrements obtenus en Ontario (4,3 %), en Alberta (13,0 %) et en Colombie-Britannique (14,9 %) pour ce groupe d'âge-sexe (voir le tableau 3.2-1). De la même façon, le surdénombrement chez les filles de 7 à 17 ans est dû à ceux obtenus au Québec (10,9 %) et en Alberta (16,7 %) pour ce groupe d'âge.
Les taux les plus élevés à l'échelle nationale sont observés chez les hommes de 18 à 24 ans, chez ceux de 25 à 34 ans, ainsi que chez les hommes de 55 à 64 ans. On remarque que le taux de sous-dénombrement chez les femmes est toujours inférieur à celui des hommes.
Tel que mentionné précédemment, l'EDM utilise la base de sondage de l'enquête sur la population active (EPA). Pour une même période, le taux de sous-dénombrement de l'EPA à l'échelle nationale est de 9,8 % (référence [5]), ce qui est légèrement inférieur au taux de 11,6 % de l'EDM observé lorsqu'on se restreint aux personnes de 15 ans et plus (données non présentées).
Puisque l'on n'ajuste plus les poids de sondage en fonction du sexe des personnes des ménages répondants, un sous-dénombrement ou surdénombrement net subsiste donc par groupe d'âge-sexe. Ce sous-dénombrement ou surdénombrement net est mesuré par le taux de glissement résiduel. Le taux de glissement résiduel est une mesure du pourcentage d'écart entre les estimations provenant des données auxiliaires et les estimations de l'enquête calculées en utilisant cette fois-ci les poids finaux. Les taux de glissement résiduels par groupe d'âge-sexe à l'échelle nationale sont présentés dans le tableau 3.1-2.
Tableau 3.1-2 Taux de glissement résiduels nationaux selon le groupe d'âge-sexe, Canada
Les taux de glissement résiduels chez les hommes et les femmes sont nécessairement de signes opposés puisque les poids ont été ajustés pour correspondre aux estimations démographiques repères de chaque groupe d'âge. Bien que l'on ne tienne plus compte du sexe dans l'ajustement des poids, il demeure que de contrôler selon l'âge aide grandement à diminuer l'ampleur du sous-dénombrement par groupe d'âge-sexe observé au tableau 3.1-1. En effet, après avoir ajusté les poids pour chaque groupe d'âge, les taux de glissement résiduels sont inférieurs à 1,2 % pour les adultes et inférieurs à 1,9 % pour les enfants à l'échelle nationale.
Taux de glissement provinciaux par groupe d'âge et sexe
Les taux de glissement par groupe d'âge et sexe à l'échelle provinciale sont présentés dans le tableau 3.2-1.
Tableau 3.2-1 Taux de glissement pour les provinces selon le groupe d'âge-sexe
On observe un sous-dénombrement net pour chacune des provinces, les taux variant de 4,1 % à 14,2 %. C'est en Alberta que l'on retrouve le plus faible taux de sous-dénombrement (4,1 %). On doit mentionner qu'un faible taux de sous-dénombrement global n'est toutefois pas garant d'une meilleure couverture. Par exemple, le taux de glissement général observé en Alberta (4,1 %) cache le pire cas de surdénombrement à l'échelle provinciale des groupes d'âge-sexe (18,2 % chez les garçons) et les pires cas de sous-dénombrement pour le groupe d'âge des 55 à 64 ans.
À l'échelle provinciale, le taux de sous-dénombrement le plus élevé est observé chez les hommes de 18 à 24 ans à Terre-Neuve-et-Labrador (34,4 %). De plus, c'est chez les hommes de 18 à 24 ans que l'on retrouve les taux de sous-dénombrement les plus élevés, soit dans les provinces de l'Atlantique ainsi qu'en Colombie-Britannique. Bien que ce soit pour ce groupe d'âge-sexe que l'on observe les taux de sous-dénombrement les plus élevés, le taux le plus élevé à l'échelle nationale est plutôt observé chez les hommes de 25 à 34 ans (voir tableau 3.2-1). Ceci s'explique par le fait qu'au Québec, chez les hommes des 18 à 24 ans, il n'y a pas d'erreur de couverture (pour être plus précis on observe un taux de glissement de -0,014 %) avant l'ajustement des poids en fonction des groupes d'âge. Par ailleurs, c'est à l'Île-du-Prince-Édouard que l'on observe les taux de glissement les plus élevés pour le groupe d'âge des 65 ans et plus. On remarque également que le schéma de variation des taux de glissement pour les groupes d'âge-sexe diffère sensiblement d'une province à l'autre.
Les taux de glissement résiduels par groupe d'âge-sexe à l'échelle provinciale sont présentés dans le tableau 3.2-2.
Tableau 3.2-2 Taux de glissement résiduel pour les provinces selon le groupe d'âge-sexe
Tout comme pour les résultats observés à l'échelle nationale, l'ajustement des poids en fonction du groupe d'âge tend à atténuer l'ampleur du sous-dénombrement ou surdénombrement par groupe d'âge-sexe observé au tableau 3.2-1. Les taux de glissement résiduels les plus élevés sont de l'ordre de 10 % à 12 %. Ces taux se retrouvent parmi les enfants de 0 à 6 ans, chez ceux de 7 à 17 ans ainsi que pour les adultes de 18 à 24 ans. Tel que mentionné précédemment, des analyses ont démontré que le sexe ne semble pas associé aux dépenses des ménages, sauf peut-être pour les ménages composés d'une seule personne. Or, la presque totalité des personnes de ces trois derniers groupes d'âge ne constituent pas des ménages d'une seule personne. Ainsi, bien que le taux de glissement résiduel soit plus élevé pour ces groupes d'âge-sexe, il n'y aurait vraisemblablement pas de biais dans les estimations découlant d'une moins bonne représentativité de ces groupes d'âge-sexe.
Notons par ailleurs que les taux de glissement globaux pour les femmes et les hommes de chaque province sont relativement faibles.
Taux de glissement selon la taille de ménage
Les taux de glissement selon les tailles de ménage que l'on utilise lors de l'ajustement des poids sont présentés dans le tableau 3.3. Un taux négatif correspond à un sous-dénombrement du nombre de ménages dans l'enquête.
Tableau 3.3 Taux de glissement pour les provinces selon la taille de ménage
On observe une sous-estimation du nombre de ménages de 8,3 % à l'échelle nationale. Cette sous-estimation est légèrement inférieure à celle de 9,3 % observée pour le nombre de personnes. De plus, on observe toujours un sous-dénombrement quelle que soit la taille de ménage, et ce, tant à l'échelle nationale que provinciale. À l'échelle nationale, il y a peu de différences dans le sous-dénombrement selon la taille de ménage, les taux variant de 7,9 % à 9,0 %.
À l'échelle provinciale, il y a une variation plus importante du taux de glissement. Cependant, l'écart observé est à peu près le même entre les tailles de ménage. En effet, pour les ménages d'une personne, le taux varie de -2,2 % pour la Nouvelle-Écosse jusqu'à -16,7 % pour Terre-Neuve-et-Labrador. Pour les ménages de deux personnes, les taux de glissement varient de -2,3 % pour la Saskatchewan à -13,7 % pour l'Ontario. Pour les ménages de trois personnes et plus, les taux de glissement varient de -2,2 % pour l'Alberta à -16,5 % pour la Saskatchewan.
À l'exception de l'Ontario, le sous-dénombrement le plus élevé est observé à peu près également entre les ménage d'une personne et les ménages de trois personnes et plus.
3.2 L'ajustement au niveau de la population et des ménages
Afin de corriger le problème de représentativité illustré dans les tableaux 3.1-1 et 3.2-1 et réduire le biais qui en découle, on ajuste les données de l'enquête lors de la pondération en utilisant les estimations démographiques pour les groupes d'âge définis dans ces tableaux, et ce pour chaque province. Pour plus de détails sur la méthodologie de l'ajustement, voir les références [1] et [6]. Cet ajustement réduit le biais mais ne l'élimine pas complètement si les caractéristiques des individus que l'on a omis de l'enquête diffèrent de celles des individus inclus pour un même groupe d'âge dans une province.
On notera également que l'efficacité de l'ajustement à partir des estimations démographiques dépend beaucoup de la qualité de ces estimations démographiques et de leur exactitude à bien représenter la population cible de l'enquête. Les estimations démographiques ne sont pas exemptes d'erreurs. Ce sont des estimations post-censitaires basées sur les comptes de population du Recensement de 2001, ajustées pour le sous-dénombrement net et qui tiennent compte des récentes statistiques sur la migration, les naissances, la mortalité, etc. Ces estimations démographiques sont ajustées pour tenir compte de certaines exclusions spécifiques aux enquêtes auprès des ménages comme les personnes vivant en institutions. Conceptuellement, elles diffèrent légèrement de la population cible de l'EDM en incluant les personnes habitant les ménages collectifs qui ne sont pas des institutions, par exemple les membres de groupes vivant en communauté et les individus vivant de façon permanente dans les hôtels ou les maisons de chambres. Cependant, on considère cette différence négligeable puisque ces individus représentent moins de 0,4 % de la population canadienne.
Pour corriger le problème de représentativité de l'échantillon par rapport au nombre de ménages selon leur taille, illustré dans le tableau 3.3, on ajuste les données de l'enquête à l'aide de données auxiliaires. En ajustant les poids de l'EDM pour refléter les estimations post-censitaires du nombre de ménages selon la taille, on vise à compenser le biais qui découle d'une représentation inadéquate des ménages. Toutefois on n'éliminera pas nécessairement ce biais si les caractéristiques des ménages non interviewés (omis ou non-répondants) diffèrent de celles des ménages répondants pour une même taille de ménage. Comme dans le cas des estimations démographiques de population, l'efficacité de l'ajustement dépend de la qualité des données auxiliaires sur le nombre de ménages.
En plus des estimations démographiques quant aux groupes d'âge par province, deux autres ensembles de données auxiliaires sont utilisés pour ajuster les données d'enquêtes lors de la pondération en vue d'en améliorer la représentativité. Le premier ensemble de données est utilisé pour contrôler le nombre d'enfants et d'adultes dans certaines grandes villes. Pour le second, des comptes par grandes catégories de revenu en salaires et traitements sont utilisés lors de l'ajustement des poids afin d'assurer une certaine cohérence entre les distributions de revenu de l'EDM et celles provenant de sources externes.
Note
- Date de modification :