Qualité des données démographiques

Warning Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Début de l'encadré

Notes relatives à la qualité des estimations démographiques

Dans ce cas, le rajustement pour le sous-dénombrement net du recensement (SDNR) inclut également le rajustement pour les réserves indiennes partiellement dénombrées.

Sauf mention contraire, le terme « provisoire » fait également référence à celui de « mise à jour ».

Fin de l'encadré

Les estimations sont entachées d'une certaine marge d'imprécision qui provient de deux types d’erreur :

  • des erreurs des données du recensement;
  • des imperfections des autres sources de données et des méthodes d'estimations des composantes.

Données du recensement

Erreurs de couverture, de réponse et de traitement

Les erreurs attribuables aux données de recensement peuvent être divisées en deux groupes : erreurs de réponse et de traitement, et erreurs de couverture. Le premier groupe comprend les erreurs de non-réponse, l'interprétation erronée de la part des répondants, le codage et l'imputation des non-réponses. Les erreurs du second groupe sont dues principalement aux estimations du sous-dénombrement du recensement et à un degré moindre au surdénombrement. Ces deux types d'erreur sont inhérents à n'importe quelle enquête.

Les erreurs de couverture se produisent lorsqu’on oublie des logements et/ou des personnes, qu’on les inclut à tort (à l’exception des recensements de 2006 et 2011, où les personnes incluses à tort ne font pas partie de l’Étude sur le surdénombrement du recensement) ou qu’on les compte plus d’une fois. Après chaque recensement, Statistique Canada entreprend des études de couverture pour mesurer ces erreurs. Les principales études sont l’Enquête sur la contre-vérification des dossiers (CVD) et l’Étude sur le surdénombrement du recensement (ESR). On tire de ces études des estimations de sous-dénombrement et de surdénombrement pour chaque province et territoire. La Division de la démographie rajuste la population dénombrée au recensement par province et territoire avec ces estimations. Au niveau infraprovincial, ces taux sont appliqués à chacune des régions géographiques de la province ou du territoire selon l’âge et le sexe.

Lors de l’élaboration des populations de départ, le programme des estimations corrige les populations du recensement pour les erreurs de couverture seulement. Cette correction, basée sur les résultats des études de couverture, est sujette principalement aux erreurs dues à l’échantillonnage et, dans une moindre mesure, à des erreurs de traitement. Les tests statistiques indiquent que les ajustements pour la couverture améliorent la qualité des données du recensement. Le programme des estimations utilise les estimations des études de couverture pour les provinces et les territoires. Cependant, étant donné la taille des échantillons de ces études, les estimations par âge et par sexe sont modélisées. De plus, on suppose que les taux de couverture estimés pour une province ou un territoire s’appliquent aux régions situées à l’intérieur de cette province ou de ce territoire. En ce qui concerne les études de couverture, les tests statistiques indiquent que l’ajustement, quoique non exempt d’erreur en soi, améliore la qualité des données du recensement (Royce, 1993). Les hypothèses sélectionnées ont l’avantage d’être cohérentes dans le temps et par région géographique, ainsi que de fournir des résultats logiques. Les utilisateurs doivent se rappeler que lorsque l'on calcule les taux de sous-dénombrement net du recensement (SDNR) pour de petites régions, il se pourrait que les hypothèses sous-jacentes ne soient pas respectées. Si tel était le cas, les taux de SDNR utilisés les induiraient en erreur. Cependant, les erreurs associées à ces hypothèses sont très difficiles à quantifier.

Les corrections apportées aux données du recensement pour le SDNR améliorent, en général, la qualité des estimations en compensant pour le sous-dénombrement différentiel aux différents recensements selon l'âge, le sexe et par province et territoire.

Le rajustement intègre également les résultats d’une étude sur l’estimation des personnes des réserves indiennes partiellement dénombrées pour compléter la correction des données du recensement pour les erreurs de couverture. Les résultats des études de couverture contiennent principalement des erreurs aléatoires liées à l’échantillonnage.

Ces rajustements ont un impact direct sur :

  • L'erreur en fin de période et sa distribution par âge et sexe à l'intérieur d'une même province ou territoire, de même que par province ou territoire, étant donné la variation du SDNR et sa distribution d'un recensement à l'autre;
  • la cohérence des estimations de population pour une même cohorte de naissance. Prenons l’exemple de la cohorte masculine des moins de 5 ans en 1981. En utilisant les données de recensement non rajustées pour le SDNR, on remarque que ce groupe est moins nombreux au Recensement de 2001 (groupe des 20 à 24 ans) qu’à celui de 1996 (groupe des 15 à 19 ans). Comme le Canada reçoit beaucoup d'immigrants à ces âges, on se serait attendu au contraire. Or, ce n’est qu’après le rajustement pour le SDNR que la taille de la cohorte augmente, comme attendu, entre 1996 et 2001.

Pour de plus amples informations sur les principales études de couverture, veuillez consulter le document suivant sur le site Internet de Statistique Canada : Rapport technique du recensement de 1996, 2001, 2006 et 2011 sur la couverture.

Composantes

Les erreurs provenant des méthodes d'estimation et des sources de données autres que le recensement ont également une importance non négligeable.

A. Naissances et décès

La loi exigeant la tenue d'un registre de l'état civil, les estimations définitives des naissances et des décès répondent à des normes de qualité très élevées. Toutefois, puisque les données provisoires sont modélisées, elles diffèrent légèrement des données définitives.

B. Immigration et résidents non permanents

En ce qui concerne les immigrants et les résidents non permanents (RNP), Immigration Réfugiés Citoyenneté Canada (IRCC) administre des fichiers propres à ces deux composantes. L'immigration étant contrôlée par une loi, les données sur les immigrants et les RNP sont systématiquement recueillies à leur arrivée au Canada. Ces données ne concernent que l'immigration « légale » et excluent donc les immigrants illégaux. Ainsi, les données sur les entrées internationales « légales » au Canada sont considérées d'une qualité supérieure. Toutefois, des biais peuvent exister quant à la destination : celle envisagée par l’immigrant au moment de l’arrivée peut différer de celle où il résidera de fait. Enfin, parce que l'information fournie par le Système sur les visiteurs (SV) de IRCC est incomplète (l'âge et le sexe des personnes à charge, la province de résidence pour certains groupes de détenteurs de permis), les estimations de RNP sont plus sujettes aux erreurs que les données sur les immigrants.

C. Émigration, émigration de retour et solde de l’émigration temporaire

Parmi les composantes qu’utilise le programme des estimations de population, l’émigration, l’émigration de retour et le solde de l’émigration temporaire sont les plus difficiles à estimer avec précision puisque le Canada n’a pas de système d’enregistrement à ses frontières. Alors que l’immigration et les résidents non permanents (RNP) sont bien documentés par le gouvernement fédéral, Statistique Canada a toujours eu recours à des techniques d’estimations indirectes pour estimer le nombre de personnes quittant le pays. Pour cette raison, les statistiques disponibles sur ces trois composantes ont toujours été d’une moins bonne précision que celles des autres composantes.

L’estimation des émigrants et des émigrants de retour provient d’informations tirées du fichier des Prestations fiscales canadiennes pour enfants (PFCE) de l’Agence du revenu du Canada (ARC). L’estimation doit être rajustée afin de tenir compte des enfants non admissibles au programme et en dériver l’émigration et l’émigration de retour des adultes.

Ces rajustements et le délai d’obtention des données sont les deux principales sources d’erreur. Comme il n’existe pas d’information courante sur les personnes temporairement à l’étranger, les estimations sont basées sur la Contre-vérification des dossiers (CVD) et le recensement. Les estimations pour la période intercensitaire, réparties également entre les cinq années, sont maintenues constantes pour la période postcensitaire. De plus, certaines hypothèses doivent être admises afin de répartir les données provinciales/territoriales par région infraprovinciale. Toute variation géographique peut entraîner une erreur dans l’estimation de ces composantes.

D. Migration interprovinciale et migration infraprovinciale

Depuis juillet 1993, les estimations provisoires de la migration interprovinciale sont établies à partir des fichiers des Prestations fiscales canadiennes pour enfants (PFCE). Sous ce programme, seulement 76 % des enfants âgés de 0 à 17 ans à l’échelle du Canada étaient bénéficiaires au 1er juillet 2001. Par conséquent, nous croyons que les estimations provisoires basées sur les PFCE sont sujettes à des erreurs plus importantes que celles définitives établies à partir des fichiers de données fiscales de l’Agence du revenu du Canada (ARC).

De plus, comme il n’y a pas de données provisoires disponibles pour la migration infraprovinciale, nous devons faire l’hypothèse que les niveaux de migration sont les mêmes que ceux de l’année précédente de sorte que les données des deux plus récentes années sont les mêmes. Elles peuvent cependant être différentes en raison de certains ajustements qui permettent de corriger les populations négatives.

E. Ventilation des composantes

La finesse de la ventilation des données accroît les risques d’erreur de sorte que la qualité de l’estimation des composantes devient plus douteuse avec le fractionnement par âge et sexe. Il semble qu’en général, les erreurs initiales soient moindres en ce qui concerne la ventilation des nombres annuels de naissances, de décès et d’immigrants, qu’en ce qui a trait à celle des autres composantes (résidents non permanents, émigrants, émigrants de retour, solde de l’émigration temporaire et migrants interprovinciaux et infraprovinciaux). Enfin, l’importance de l’erreur causée par la distinction selon l’âge et le sexe peut varier selon la période, et l’erreur relative à certaines composantes peut avoir un effet plus prononcé sur certains groupes d’âge ou sur un sexe donné.

Changement de géographie

Les limites des régions géographiques infraprovinciales peuvent changer d’un recensement à l’autre. Pour faciliter les études chronologiques, les estimations démographiques pour la période allant de 2001 à 2013 ont été établies, dans la présente publication, selon les limites définies par la Classification géographique type (CGT) 2011 pour les DR, les RMR ainsi que les RÉ.

Afin de préciser l’importance démographique des changements de limites géographiques, les effectifs de la population au Recensement de 2006 sont dans un premier temps convertis vers la CGT 2011. Par la suite, on compare ces effectifs convertis aux effectifs de la population de 2006 selon la CGT 2006. Les chiffres présentés ici s’appliquent à la population dénombrée au Recensement de 2006 et ne tiennent pas compte du sous-dénombrement net du recensement.

Régions métropolitaines de recensement (RMR)

Parmi les 34 RMR définies selon la CGT 2006, sept ont connu des changements de limites géographiques avec le passage vers la CGT 2011. Si les nouvelles limites avaient été appliquées en 2006, la population de l’ensemble des 34 RMR aurait été non pas de 21 509 000, mais de 21 534 000, soit une légère hausse de 25 000 (0,1 %).

L’importance démographique des changements de limites est relativement faible pour la plupart des RMR, soit en dessous de 5 % pour Saguenay, Québec, Sherbrooke, Trois-Rivières, Montréal et Ottawa-Gatineau. La RMR de Guelph a la proportion la plus élevée à 5,3 %.

Régions économiques (RÉ)

Quatre RÉ ont changé de limites sur les 76 avec le passage de la CGT 2006 vers celle de 2011. Comme les RÉ couvrent l’ensemble du pays et que leur nombre n’a pas changé, les changements sont plutôt simples. Au Nouveau-Brunswick, il y a eu des changements entre les limites de Campbellton-Miramichi et Fredericton-Oromocto. En Colombie-Britannique, la RÉ de Côte-nord a reçu une partie de la population de la RÉ de Nechako. Les écarts avoisinent plus ou moins 1 %.

Divisions de recensement (DR)

Des changements de limites ont affecté 22 des 293 DR au pays. Dans six cas, les changements de limites géographiques n’ont eu aucun effet marqué sur la population, les pertes ou les gains relatifs ne dépassant pas 0,1 %.

Aux Territoires du Nord-Ouest, les DR ont été restructurées et leur nombre est passé de deux à six. Par conséquent, l’ancienne DR de Fort Smith, aujourd’hui appelé Région 6, a vu sa population chuter de 40,5 %. En Colombie-Britannique, une nouvelle DR a été formée à partir de la DR de Comox-Strathcona, les deux DR sont désormais désignées par Strathcona et Comox Valley. Une seule autre DR a connu un changement majeur de ses limites, soit Stikine, qui a perdu 43,0 % de sa population au profit de la DR de Kitimat-Stikine.

Évaluation de la qualité

Afin d’évaluer la qualité de nos estimations, deux mesures d’évaluation sont utilisées : les erreurs de précocité et les erreurs en fin de période.

A. Erreurs de précocité

La qualité des estimations démographiques provisoires des composantes est évaluée à l’aide des erreurs de précocité. L’erreur de précocité correspond à la différence entre l’estimation provisoire et l’estimation définitive d’une composante donnée divisée par la population totale de la région géographique en cause. L’erreur de précocité peut se calculer tant pour les estimations de la population que pour celles des composantes. L’erreur de précocité mesure l’incidence du compromis entre l’exactitude et l’actualité, en faveur de la seconde, sur la population estimée. L’erreur de précocité est calculée comme suit :

L’erreur de précocité d’une composante nous renseigne sur l’ampleur de l’erreur entre l’estimation provisoire et définitive de la population. L’analyse de l’erreur de précocité nous permet de procéder à des comparaisons utiles entre les composantes ainsi qu’entre les différents niveaux géographiques ayant des populations de tailles différentes. L’erreur de précocité peut être positive ou négative. Une erreur de précocité positive indique une estimation provisoire supérieure à l’estimation définitive, alors qu’une erreur de précocité négative indique l’inverse. À noter qu’en comparant à la population totale d’une région, les différences entre les estimations provisoires et définitives des composantes sont minimes. Il existe toutefois des écarts quant à l’incidence de ce type d’erreur entre les composantes et entre les régions géographiques.

Règle générale pour les estimations infraprovinciales, les soldes migratoires interprovincial et infraprovincial sont associés aux erreurs de précocité les plus importantes. Cet état des choses est dû à l’utilisation de sources de données différentes pour les estimations provisoires et définitives. Pour la plupart des années et des provinces/territoires, des erreurs de précocité plus faibles sont associées aux estimations de l’immigration, des naissances et des décès. Dans le cas des estimations de l’immigration, cette situation est attribuable à l’intégralité des sources de données et à l’accessibilité des données permettant de produire des estimations provisoires plus à jour. En ce qui a trait aux naissances et aux décès, les petites erreurs de précocité s’expliquent par l’utilisation de projections à court terme pour la production des estimations provisoires.

Dans l'hypothèse où la qualité des données de base demeure inchangée, les présentes estimations postcensitaires devraient présenter un niveau de fiabilité fort acceptable si l’on en juge par l’analyse des dernières erreurs de précocité observées.

B. Erreur en fin de période

L’erreur en fin de période permet de mesurer l’exactitude des estimations postcensitaires. Elle est définie comme la différence entre les estimations postcensitaires, au jour du recensement, et la population dénombrée et corrigée du sous-dénombrement net du recensement (SDNR). Une erreur en fin de période positive signifie que les estimations démographiques postcensitaires ont surestimé la population.

L'erreur en fin de période provient de deux sources : les erreurs principalement dues à l’échantillonnage dans la mesure de la couverture du recensement et les erreurs relatives aux composantes de l'accroissement démographique pendant la période intercensitaire. Pour chaque période intercensitaire quinquennale, l'erreur en fin de période ne peut être calculée qu'au moment de la diffusion des données du recensement et des estimations du SDNR. Elle est calculée pour la population totale de chaque province et territoire ainsi que selon l'âge et le sexe.

En ramenant cette différence à la population censitaire, on obtient un taux qui, à l’échelle du pays, est peu important (0,2 % en 2001, 0,1 % en 2006 et 0,5 % en 2011). À l’échelle des provinces et des territoires, de même qu’au niveau infraprovincial, les différences sont généralement plus élevées, cette différence étant due à la plus forte variabilité associée aux estimations de la migration interprovinciale et infraprovinciale. Ceci étant dit, les estimations postcensitaires provinciales et territoriales diffèrent généralement de moins de 1 % des populations censitaires rajustées, sauf pour les territoires et à quelques exceptions près.

Au niveau des régions métropolitaines de recensement (RMR), les estimations démographiques ont surestimé la population de l’ensemble des RMR (0,9 %) ainsi que de 24 des 34 RMR du pays. Les estimations démographiques différaient de plus de 2 % des chiffres censitaires rajustés pour 4 RMR : Winnipeg (3,0 %), Victoria (2,4 %), St. John’s (-2,1 %) et Halifax (2,0 %).

Les estimations démographiques ont surestimé la population de 33 des 76 régions économiques (RÉ) du pays. L’écart entre les estimations démographiques et les chiffres censitaires rajustés surpasse 3 % pour 4 RÉ: Nechako, C.-B. (-4,4 %), Yorkton – Melville, Sask. (-3,3 %), Nord, Sask. (-3,2 %) et Montréal, Qc (3,1 %).

La population de 124 des 293 divisions de recensement (DR) du pays a été surestimée par les estimations démographiques. Pour 99 DR, la différence entre les estimations démographiques et les chiffres du recensement rajusté est inférieure à 1 %. L’erreur en fin de période de 267 DR, c’est-à-dire 91 % des DR, se situe entre -3 % et 3 %. Les erreurs en fin de période les plus prononcées se trouvent dans la Division No. 11 de Terre-Neuve-et-Labrador (8,8 %), dans la Région 4 des Territoires du Nord-Ouest (6,4 %) et dans la Division No. 19 du Manitoba (6,0 %). Dans les deux premiers cas, il s’agit de DR pour lesquelles la population est inférieure à 4 000 habitants.

Date de modification :