Section 3
Les erreurs de couverture

Warning Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Le sous-dénombrement et le surdénombrement : les taux de glissement
L'ajustement au niveau de la population et des ménages

Lors de la conception de l'enquête, on a défini la population visée, qu'on appelle la population cible. Rappelons d'abord la définition de cette population cible pour l'enquête sur les dépenses des ménages (EDM) puisqu'une bonne compréhension de la population cible est nécessaire à une bonne interprétation des données de l'enquête. Il est important de préciser que l'EDM utilise la base de sondage de l'enquête sur la population active (EPA).

La population cible

La population cible correspond aux individus vivant dans les ménages privés. Les pensionnaires d'établissement institutionnel tel que les prisons, les hôpitaux pour malades chroniques, les résidences pour personnes âgées ainsi que les membres d'ordres religieux et d'autres groupes vivant en communauté, les membres des Forces Armées vivant dans les camps militaires et les individus vivant de façon permanente dans les hôtels ou les maisons de chambres sont donc exclus. On exclut aussi les représentants officiels de pays étrangers qui vivent au Canada et leurs familles ainsi que les résidents des réserves indiennes et des terres publiques (à l'exception des Territoires). L'enquête couvre donc près de 98 % de la population dans les 10 provinces. Au Yukon, la couverture de la population est de 92 %, celle des Territoires du Nord-Ouest correspond à 92 % et la couverture du Nunavut est de 91 %1.

Nous n'avons pas recueilli de renseignements auprès des personnes qui vivent temporairement loin de leur famille (par exemple, les étudiants d'université) parce que nous obtenons l'information auprès de leur famille, si elle est choisie dans l'échantillon.

Les erreurs de couverture proviennent d'une représentation inadéquate de la population cible à partir des unités de la base de sondage. Certaines unités de la population cible peuvent être omises de la base de sondage, on parle alors d'un sous-dénombrement. D'autres unités qui ne sont pas dans la population cible peuvent être incluses par erreur ou certaines unités peuvent être incluses plus d'une fois, ces unités sont responsables du surdénombrement.

3.1 Le sous-dénombrement et le surdénombrement : les taux de glissement

Dans l'EDM, la sélection de l'échantillon est effectuée en utilisant une liste de logements dans chaque grappe sélectionnée. L'omission de logements lors de la création de la liste, les nouveaux logements qui s'ajoutent entre la création de la liste et la visite des intervieweurs (principalement dans les secteurs en développement) ainsi que la classification erronée de logements vacants contribuent au sous-dénombrement. Le fait d'inclure des logements qui ne seraient pas dans les limites de la grappe est une source de surdénombrement. De façon similaire, des erreurs peuvent se glisser lors de la collecte des données, lors de l'identification des personnes qui sont membres du ménage sélectionné. Ces erreurs contribuent également au sous-dénombrement et au surdénombrement.

De plus, tel que décrit à la section 2.4, des méthodes de repondération sont mises en place pour tenir compte de la non-réponse. Lors de ces ajustements, il est cependant impossible de corriger les poids d'enquête pour faire en sorte que tous les sous-groupes de la population soient bien représentés.

Une bonne représentation de la population cible est indispensable à la production d'estimations de dépenses réalistes. Il est nécessaire que l'échantillon représente adéquatement les individus de la population cible et la distribution des ménages selon leur taille.

On observe généralement un sous-dénombrement net du nombre de personnes et du nombre de ménages dans l'EPA, que l'on rectifie par un ajustement des poids en utilisant des données auxiliaires, ou repères, qui sont basées sur des estimations démographiques post-censitaires. Le taux de glissement (voir annexe A) est une mesure du pourcentage d'écart entre les estimations provenant de ces données auxiliaires et les estimations de l'enquête calculées en utilisant des poids non ajustés avec ces données.2 Le glissement représente donc l'effet cumulé du sous-dénombrement et du débalancement dans certains sous-groupes de la population créé par la non-réponse à l'enquête qui n'a pu être corrigée à l'étape de la repondération.

Les taux de glissement par groupe d'âge à l'échelle nationale et provinciale sont présentés dans le tableau 3.1 alors que les taux de glissement selon les tailles de ménages que l'on utilise lors de l'ajustement des poids se trouvent dans le tableau 3.2. Un taux positif correspond à un surdénombrement du nombre de personnes ou de ménages dans l'enquête.

Tableau 3.1 Taux de glissement pour les provinces et les territoires selon le groupe d'âge

Pour l'EDM de 2007, le taux de sous-dénombrement net de la population était 13,2 %, en excluant les territoires. En analysant le tableau 3.1 au niveau des groupes d'âge, on constate qu'à l'échelle nationale (sans les territoires), les taux de glissement des enfants (0 à 6 ans et 7 à 17 ans) sont très différents de ceux des autres groupes d'âge. En effet, le taux de sous-dénombrement net pour l'ensemble des enfants est de 9,1 %, alors qu'il est de 14,3 % pour les adultes (données non présentées). Les taux de glissement chez les 55 ans et plus sont également plus faibles que pour les autres adultes. Les taux les plus élevés à l'échelle nationale sont observés chez les individus âgés de 25 à 34 ans ainsi que chez les 35 à 44 ans.

On observe également un sous-dénombrement net pour chacune des provinces. C'est au Manitoba que l'on retrouve le plus faible taux de sous-dénombrement net (8,5 %). Le taux de sous-dénombrement net le plus élevé se retrouve en Alberta où il se situe à 17,8%.

En analysant le croisement des provinces et des groupes d'âge, on remarque que le taux de sous-dénombrement net le plus élevé est observé chez les 18 à 24 ans en Nouvelle-Écosse (36,0 %). On remarque également que le schéma de variation des taux de glissement pour les groupes d'âge diffère sensiblement d'une province à l'autre. On note toutefois que les pires taux de sous-dénombrement sont en règle générale observés chez les 18 à 24 ans, chez les 25-34 ans ou chez les 35-44 ans. On retrouve les taux les plus faibles chez les 0 à 6 ans, les 7 à 17 ans ou les 55 ans ou plus, tel qu'observé au niveau national.

Tel que mentionné précédemment, l'EDM utilise la base de sondage de l'enquête sur la population active (EPA). Pour une même période, le taux de sous-dénombrement de l'EPA à l'échelle nationale est de 10,1 % (référence [5]), ce qui est inférieur au taux de 14,3 % de l'EDM observé lorsqu'on se restreint aux personnes de 15 ans et plus.

Tableau 3.2 Taux de glissement pour les provinces et territoires selon la taille de ménage

On observe une sous-estimation du nombre de ménages de 10,4 % à l'échelle nationale. Cette sous-estimation est légèrement inférieure à celle de 13,2 % observée pour le nombre de personnes. De plus, on observe généralement un sous-dénombrement quelle que soit la taille de ménage, et ce, tant à l'échelle nationale que provinciale. À l'échelle nationale, le taux de sous-dénombrement des ménages d'une seule personne (8,9 %) est identique au taux correspondant pour les ménages de deux personnes (8,9 %) mais est largement inférieur au taux de sous-dénombrement des ménages de trois personnes et plus (12,8 %).

À l'échelle provinciale, on note également une variation marquée du taux de glissement, les taux variant de -5,3 % à l'Île-du-Prince-Édouard à -15,6 % en Colombie-Britannique. Ces taux sont généralement cohérents avec les taux de glissement au niveau des individus présentés au tableau 3.1.

3.2 L'ajustement au niveau de la population et des ménages

Afin de corriger le problème de représentativité illustré dans le tableau 3.1et réduire le biais qui en découle, on ajuste les données de l'enquête lors de la pondération en utilisant les estimations démographiques pour les groupes d'âge définis dans ces tableaux, et ce pour chaque province. Pour plus de détails sur la méthodologie de l'ajustement, voir les références [1] et [6]. Cet ajustement réduit le biais mais ne l'élimine pas complètement si les caractéristiques des individus que l'on a omis de l'enquête diffèrent de celles des individus inclus pour un même groupe d'âge dans une province.

On notera également que l'efficacité de l'ajustement à partir des estimations démographiques dépend beaucoup de la qualité de ces estimations démographiques et de leur exactitude à bien représenter la population cible de l'enquête. Les estimations démographiques ne sont pas exemptes d'erreurs. Ce sont des estimations post-censitaires basées sur les comptes de population du Recensement de 2001, ajustées pour le sous-dénombrement net et qui tiennent compte des récentes statistiques sur la migration, les naissances, la mortalité, etc. Ces estimations démographiques sont ajustées pour tenir compte de certaines exclusions spécifiques aux enquêtes auprès des ménages comme les personnes vivant en institutions. Conceptuellement, elles diffèrent légèrement de la population cible de l'EDM en incluant les personnes habitant les ménages collectifs qui ne sont pas des institutions, par exemple les membres de groupes vivant en communauté et les individus vivant de façon permanente dans les hôtels ou les maisons de chambres. Cependant, on considère cette différence négligeable puisque ces individus représentent moins de 0,4 % de la population canadienne.

Pour corriger le problème de représentativité de l'échantillon par rapport au nombre de ménages selon leur taille, illustré dans le tableau 3.2, on ajuste les données de l'enquête à l'aide de données auxiliaires. En ajustant les poids de l'EDM pour refléter les estimations post-censitaires du nombre de ménages selon la taille, on vise à compenser le biais qui découle d'une représentation inadéquate des ménages. Toutefois on n'éliminera pas nécessairement ce biais si les caractéristiques des ménages non interviewés (omis ou non-répondants) diffèrent de celles des ménages répondants pour une même taille de ménage. Comme dans le cas des estimations démographiques de population, l'efficacité de l'ajustement dépend de la qualité des données auxiliaires sur le nombre de ménages.

En plus des estimations démographiques quant aux groupes d'âge par province, deux autres ensembles de données auxiliaires sont utilisés pour ajuster les données d'enquêtes lors de la pondération en vue d'en améliorer la représentativité. Le premier ensemble de données est utilisé pour contrôler le nombre d'enfants et d'adultes dans certaines grandes villes. Pour le second, des comptes par grandes catégories de revenu en salaires et traitements sont utilisés lors de l'ajustement des poids afin d'assurer une certaine cohérence entre les distributions de revenu de l'EDM et celles provenant de sources externes.


Notes

  1. Ce qui est de la proportion de ménages, la couverture du Yukon, des Territoires du Nord-Ouest et du Nunavut correspond respectivement à 92 %, 93 % et 92 % des ménages.
  2. On utilise les sous-poids, c'est-à-dire les poids de sondage ajustés pour la non-réponse (voir Annexe A).
Date de modification :