Statistique Canada
Symbole du gouvernement du Canada

Liens de la barre de menu commune

Section 4 Qualité des données

Avertissement Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Historique
Appariement des régions géographiques du Recensement de 2006
Précision de localisation
Précision des attributs
Cohérence logique
Uniformité avec d'autres produits
Intégralité

Les énoncés sur la qualité des données spatiales ont pour objet de permettre de déterminer dans quelle mesure les données spatiales conviennent à un usage particulier en décrivant pourquoi, quand et comment elles ont été créées et en indiquant leur précision. Ces énoncés comprennent un aperçu portant sur l'objet et l'utilisation, ainsi que des énoncés ayant trait à l'historique, à la précision de localisation, à la précision des attributs, à la cohérence logique et à l'intégralité. Ces renseignements sont fournis aux utilisateurs pour tous les produits de données spatiales diffusés dans le cadre du recensement.

Historique

L'historique des données spatiales comprend une description des fichiers d'origine à partir desquels les données ont été extraites ainsi que des méthodes utilisées, y compris la date des fichiers d'origine et les transformations effectuées en vue de la production de la version définitive des fichiers numériques ou des produits cartographiques.

Le Fichier de conversion des codes postaux (FCCP) est le résultat de deux mises à jour. Une première est menée tous les cinq ans, après chaque recensement, pour aligner la base de données en fonction des régions géographiques de recensement le plus récent. L'autre activité d'actualisation consiste dans les activités de maintien continues qui permettent d'apparier les codes postaux les plus récents de la Société canadienne des postes (SCP) aux unités géographiques de recensement. Ces liens sont enregistrés sur la base de données des codes postaux de la Division de la géographie.

Appariement des régions géographiques du Recensement de 2006

Documents de base

Les documents de base utilisés pour mettre à jour les liens géographiques du recensement de 2001 à 2006 étaient :

  • mises à jour mensuelles du fichier Recherche d'adresses, du fichier des modes de livraison selon le code postal et du fichier sur les chefs de ménage de la SCP
  • Infrastructure des données spatiales (IDS) de la Division de la géographie
  • Recensement de population et des logements de 2006
  • FCCP de septembre 2006
  • le fichier des données des côtés d'îlot, des îlots de diffusion et des points représentatifs du Recensement de 2006
  • fichier de correspondance des aires de diffusion

Procédures

La méthode appliquée pour effectuer le rapprochement entre les régions géographiques du Recensement de 2006 et le FCCP peut se résumer ainsi :

  1. Traitement de l'information contenue dans les fichiers de la SCP
  2. Géocodage automatisé des codes postaux aux côtés d'îlot, aux îlots de diffusion ou aux aires de diffusion du Recensement de 2006
  3. Attribution des aires de diffusion du Recensement de 2006 aux codes postaux en utilisant la correspondance entre les régions géographiques du Recensement de 2001 et du Recensement de 2006
  4. Géocodage manuel des codes postaux
  5. Vérification par échantillonnage des enregistrements des codes postaux
  6. Attribution d'un indicateur de lien unique (ILU)
  7. Associer les niveaux de géographie supérieurs.

1re étape : Traitment de l'information contenue dans les fichiers de la SCP

Les fichiers envoyés chaque mois par la SCP entre octobre 2006 et décembre 2009 sont traités afin que soient attribués une date de création, une date de retrait, un mode de livraison historique (H_ML) et un mode de livraison (ML). Les enregistrements sont extraits du fichier Recherche d'adresses de la SCP avec le code postal, le Genre de code postal (CPgenre) et l'ensemble des données connexes sur l'adresse. La date de création est la date à laquelle le code postal a été activé. La date de retrait est la date à partir de laquelle le code postal a été supprimé des fichiers mensuels de la SCP. Le mode de livraison est attribué au moyen du fichier des modes de livraison. Lorsque le ML d'un code postal est mis à jour, le ML précédent devient le H_ML. On attire l'attention des utilisateurs sur le fait que certains codes postaux sont retirés puis réintroduits à une date ultérieure et qu'il est possible qu'ils soient réactivés à un autre emplacement.

2e étape : Géocodage automatisé des codes postaux aux côtés d'îlot, aux îlots de diffusion ou aux aires de diffusion du Recensement de 2006

Tous les codes postaux valides en dcembre 2009 sont géocodés au moyen d'un nouveau système de géocodage automatisé. Une discussion approfondie à propos de la nouvelle approche en matière de géocodage est présentée dans le document de travail intitulé Mise en correspondance des codes postaux et des régions géographiques (numéro 92F0138MIF2007001 au catalogue), disponible sur le site Web de Statistique Canada à l'adresse à www.statcan.gc.ca.

Le nouveau système utilise le fichier du secteur de recherche de la région de tri d'acheminement (RTA) ainsi qu'une correspondance entre la collectivité de la SCP et la subdivision de recensement (SDR) pour définir le secteur général à l'intérieur duquel on trouvera le code postal. Les réponses au Recensement sont utilisées pour créer des secteurs de recherche des RTA. Ces secteurs de RTA rassemblent les aires de diffusion dans lesquelles une RTA particulière a été déclarée lors du Recensement de 2006. Les correspondances entre les « municipalités » de Postes Canada et les subdivisions du Recensement de 2006 sont établies à l'aide de la province de la municipalité et de l'analogie dans le nom. Lorsque la correspondance n'est pas clairement établie, les anciens fichiers des SDR de l'Infrastructure des données spatiales (IDS) sont utilisés pour établir la correspondance.

Les codes postaux attribués à des tranches d'adresses municipales (CPgenre 1 et 2) sont codés dans l'IDS pour être appariés à l'aire de diffusion, à l'îlot de diffusion ou au côté d'îlot approprié. Environ 94 % des enregistrements de code postal de CPgenre 1 et 2 du FCCP de décembre 2009 étaient géocodés ainsi.

Dans le Recensement de 2006, la réponse au code postal est utilisée pour le codage des routes rurales, des boîtes des installations postales et des bureaux de poste et des codes postaux qui desservent des secteurs de service généraux. Ces codes postaux sont géocodés au niveau de l'aire de diffusion (AD). Un procédé postal visant à éliminer toute répétition dans l'attribution des AD réduit le nombre d'AD appariées. Toutefois, tous les codes postaux actifs ne sont pas géocodés de cette façon, soit parce que les données concernant l'adresse sont introuvables soit parce que la réponse de recensement n'est pas suffisamment significative (au moins quatre réponses pour un même code postal par îlot de diffusion) pour permettre de déterminer le secteur de géocodage pertinent.

Un indicateur de qualité (IQ) est attribué au cours du processus de géocodage automatisé. L'indicateur est établi en fonction de la fiabilité de l'appariement entre un code postal et une région géographique. Se reporter à l'Annexe D Indicateur de qualité pour plus de détails.

3e étape : Attribution des aires de diffusion du Recensement de 2006 aux codes postaux en utilisant la correspondance entre les régions géographiques du Recensement de 2001 et du Recensement de 2006

Lorsque le système automatisé de jumelage des adresses ne permet pas d'établir une correspondance, les codes postaux qui étaient imputés précédemment à une région géographique du Recensement de 2001 sont appariés à une région géographique du Recensement de 2006 au moyen de la correspondance entre les régions géographiques des Recensements de 2001 et 2006 (basé sur les aires de diffusion du Recensement de 2001 dans le FCCP de septembre 2006). Ces appariements sont créés uniquement au niveau des AD du Recensement de 2006.

4e étape : Géocodage manuel des codes postaux

Lorsque le processus automatisé ne permet pas de les coder à un niveau de précision acceptable ou s'il est impossible de les convertir au moyen de la correspondance établie entre les régions géographiques des Recensements de 2001 et de 2006, les codes postaux doivent être géocodés manuellement.

Dans les régions adressables couvertes par l'Infrastructure des données spatiales (IDS), on tente de relier les codes postaux à un ou plusieurs côtés d'îlot. La liste des enregistrements des nouveaux codes postaux et des tranches d'adresses de la SCP est appariée aux répertoires des rues de l'IDS à partir de certains éléments communs aux deux fichiers : la province, la municipalité, le nom de la rue, le type de rue, l'orientation de la rue et la tranche d'adresses. Une fois l'appariement réalisé, le code postal et les codes de la région géographique correspondants sont transférés à la base de données des codes postaux.

Pour les codes postaux n'ayant pu être appariés à partir de la méthode précédente, il est nécessaire d'utiliser des cartes municipales pour localiser la (les) rue(s). S'il s'avère impossible de repérer la rue sur le plan municipal ou au moyen d'une autre source autorisée, on communique avec les autorités locales (comme les services d'urbanisme et d'ingénierie ainsi que les bureaux de poste locaux) afin d'obtenir leur aide. Dans les secteurs en forte expansion, il est nécessaire d'acquérir de nouveaux plans. Une fois la rue localisée, on utilise la position de la limite de cette rue dans l'IDS afin de repérer l'aire de diffusion nécessaire à l'appariement.

5e étape : Vérification par échantillonnage des enregistrements des codes postaux

La relation établie entre le code postal, les îlots de diffusion et les aires de diffusion est validée par échantillonnage des enregistrements réalisé à partir du géocodage effectué lors des processus décrits ci-dessus. Ces enregistrements sont géocodés manuellement de façon indépendante. Les deux séries de géocodes sont comparées dans le cadre de la vérification.

6e étape : Attribution d'un indicateur de lien unique (ILU)

Un bon nombre de codes postaux comprennent des enregistrements multiples dans le FCCP. Un indicateur de lien unique (ILU) est créé afin de permettre aux utilisateurs d'exploiter plus facilement les codes postaux comprenant des enregistrements multiples. L'ILU fournit un enregistrement géographique pour cartographier le point représentatif d'un code postal. L'indicateur de lien unique a une valeur de « 1 » afin de repérer le meilleur (ou le seul) lien pour un code postal donné. La valeur « 0 » indique un enregistrement supplémentaire.

Soulignons que l'indicateur de lien unique est indiqué tant sur les codes postaux actifs que retirés. Lorsqu'ils utiliseront des codes postaux actifs et retirés, les utilisateurs verront que plusieurs ILU s'affichent dans le cas d'un code postal retiré et réactivé. Toutefois, il n'y aura qu'un seul ILU pour une série d'enregistrements actifs pour un code postal. Lorsque nous attribuons l'ILU, la priorité est accordée aux codes postaux correspondant à des adresses civiques ou à des logements (en fonction du CPgenre). La fiabilité du codage de la région géographique (indicateur de qualité) et la précision du géocodage (côté d'îlot, aire de diffusion ou îlot de diffusion), ainsi que la population, sont prises en compte. Lorsque le code postal est apparié à une AD elle-même associée à plusieurs unités comme une circonscription électorale fédérale (CEF), une région urbaine (RU) ou une localité désignée (LD), l'ILU est alors attribué à l'enregistrement qui représente la plus grande population, que ce soit au niveau de la CEF, de la RU ou de la LD.

Les utilisateurs doivent faire preuve de prudence lorsqu'ils ont recours à l'ILU, puisque la correspondance obtenue entre le code postal et les autres unités géographiques ne sera que partielle.

7e étape : Associer les niveaux de géographie supérieurs

On désigne les niveaux de géographie supérieurs en fonction de l'identificateur unique du côté d'îlot, d'îlot de diffusion et d'aire de diffusion. Pour obtenir une vue d'ensemble des relations entre les unités géographiques, consulter le tableau de hiérarchie des unités géographiques. Lorsqu'une aire de diffusion est associée à plus d'une CEF, LD ou RU, l'appariement de ce code postal à des aires de diffusion fera l'objet de plus d'un enregistrement au FCCP.

Précision de localisation

La précision de localisation représente la précision absolue et relative de la localisation des caractères géographiques. La précision absolue s'entend du degré de correspondance entre les coordonnées figurant dans l'ensemble de données et les vraies valeurs ou celles acceptées comme telles. La précision relative s'entend du degré de correspondance entre la localisation relative des caractères et leur vraie localisation relative ou celle acceptée comme telle. Les énoncés relatifs à la précision de localisation font état de la qualité du fichier ou du produit final après toutes les transformations dont il a fait l'objet.

Les coordonnées géographiques associées aux codes postaux correspondent aux points représentatifs du côté d'îlot, de l'îlot de diffusion, ou de l'aire de diffusion calculés aux fins du recensement. Ainsi, la précision de localisation des codes postaux dépend :

  • de la précision de l'appariement entre le code postal et le côté d'îlot, l'îlot de diffusion ou l'aire de diffusion
  • de la précision de localisation des points représentatifs du côté d'îlot, de l'îlot de diffusion et de l'aire de diffusion vis-à-vis les côtés d'îlots, les îlots de diffusion et les aires de diffusion en question.

Le degré de précision des liens contenus dans le FCCP varie en fonction des différentes méthodes utilisées pour obtenir ces liens. Les appariements au niveau du côté d'îlot sont jugés les plus précis étant donné l'utilisation des tranches d'adresses fournies par la SCP pour les localiser. Lorsque l'appariement à un côté d'îlot n'a pas être établi, le code postal était apparié à un îlot de diffusion ou une aire de diffusion.

Le tableau 4.1 illustre le plus bas niveau auquel les codes postaux associés aux tranches d'adresses (CPgenre 1 et 2) ont été géocodés.

Tableau 4.1 Code postaux géocodés de types CPgenre 1 et 2 - actif en décembre 2009

L'indicateur de qualité (IQ) illustre la fiabilité du lien établi entre le code postal et la région géographique plus précise pour chaque enregistrement géocodé à l'aide du système automatisé. Pour obtenir de plus amples renseignements sur l'indicateur de qualité, veuillez vous reporter à l'Annexe D Indicateur de qualité.

Les coordonnées géographiques comprises dans le FCCP sont tirées de l'Infrastructure des données spatiales (IDS) de Statistique Canada. Les utilisateurs doivent être conscients qu'une précision de localisation absolue ne représente pas une caractéristique recherchée par l'IDS. Par conséquent, ces fichiers et tous les sous-produits dérivés ne sont pas recommandés pour les applications légales ou reliées à l'ingénierie ou pour la répartition des services d'urgence.

Pour plus de renseignements sur la méthode utilisée dans le calcul des points représentatifs des côtés d'îlot, des îlots de diffusion et des aires de diffusion, voir l'Annexe E Points représentatifs.

Précision des attributs

Par précision des attributs, on entend la précision des données quantitatives et qualitatives reliées à chaque caractère (tels que la population pour une région urbaine, le nom de rue, le nom et le code de la subdivision de recensement).

Le FCCP est un fichier non hiérarchique qui offre les attributs des codes postaux et des aires de diffusion et des îlots de diffusion, etc. appariés à ces codes postaux. La plupart de ces attributs proviennent de deux sources indépendantes. Quelques attributs ont aussi été créés pour les besoins du FCCP.

Le code géographique, le type et le nom de toutes les régions géographiques normalisées supérieures auxquels un côté d'îlot, un îlot de diffusion ou une aire de diffusion est attribué sont extraits de l'Infrastructure des données spatiales.

Les renseignements relatifs au code postal – date de création, date de retrait, type de mode de livraison, genre de code postal et nom de la communauté (SCP) – sont tirés de la base de données des codes postaux et des tranches d'adresses de la SCP. Dans certains cas, le genre de code postal a été imputé par Statistique Canada (voir Spécifications techniques).

L'indicateur de lien unique (ILU; voir Procédures) et le type de point représentatif sont des attributs créés par Statistique Canada.

Des tests sont exécutés pour s'assurer que certaines relations de données de base sont uniformes à l'ensemble d'enregistrements dans le FCCP.

Cohérence logique

La cohérence logique décrit la fidélité des relations encodées dans la structure des données spatiales numériques.

Dans certains cas, surtout dans les régions rurales, la zone de service associée à un code postal croise les limites des aires de diffusion. En pareil cas, le même code postal peut être répété à deux ou à plusieurs reprises en étant apparié à des renseignements géographiques différents (c'est-à-dire des coordonnées géographiques ou des codes d'aire de diffusion différents). Ces enregistrements multiples reflètent le lien entre le code postal et les unités géographiques du recensement. Un code postal peut aussi être apparié à plus d'un côté d'îlot ou îlot de diffusion à l'intérieur d'une même aire de diffusion.

À l'inverse, il peut arriver que des codes postaux distincts soient associés aux mêmes coordonnées. Cela se produit lorsque plus d'un code postal est apparié à la même aire de diffusion. Plus d'un code postal peut également être apparié à un seul côté d'îlot ou îlot de diffusion.

Chaque ensemble d'enregistrements actifs associé à un code postal comporte un ILU équivalant à « 1 ». Chaque ensemble d'enregistrements retirés associé à un code postal, selon une date de retrait donnée, comporte un ILU équivalant à « 1 ».

Uniformité avec d'autres produits

Les données présentées dans le FCCP sont cohérentes avec l'ensemble des produits géographiques reliés au Recensement de 2006, sauf le Fichier des limites des régions de tri d'acheminement censitaires (numéro 92-170-XWF, XCF au catalogue), qui représente seulement les codes postaux inscrits par les ménages au Recensement de 2006. Le FCCP comprend l'ensemble des codes postaux (à la fois actifs et retirés) et est mis à jour deux fois par année pour tenir compte des nouveaux codes postaux.

Intégralité

L'intégralité indique dans quelle mesure les traits géographiques, leurs attributs et leurs relations sont inclus dans l'ensemble de données ou en sont omis. Elle comprend aussi des renseignements sur les critères de sélection, les définitions utilisées et les autres règles cartographiques pertinentes.

Dans le contexte du FCCP, l'intégralité correspond à la mesure selon laquelle tous les codes postaux valides sont intégrés au FCCP et tous les codes des unités géographiques du Recensement de 2006 sont appariés à un code postal. Tous les codes postaux valides, en date de décembre 2009 selon la SCP, sont appariés à une unité géographique du recensement. Il y a 460 aires de diffusion peuplées qui n'ont pas été appariées à aucun des codes postaux dans le FCCP. De toutes les aires de diffusion qui sont liées à un code postal, il y a douze aires de diffusion peuplées qui n'ont pas été appariées à un code postal actif dans le FCCP.

Il y aussi 5 126 codes postaux retirés qui sont inclus dans le FCCP. Les codes postaux retirés avant le 1er janvier 2006 sont inclus dans le fichier Retiré 2005 (R2005.txt). Le fichier Retiré 2005 contient 59 247 codes postaux retirés.

L'indicateur de qualité (IQ) n'est en ce moment disponible que pour les enregistrements traités au moyen du processus de géocodage automatisé. Lorsque les codes postaux étaient géocodés selon les renseignements relatifs à l'adresse, chacun des trois caractères de l'IQ comportait les lettres « A », « B » ou « C », une indication de la fiabilité du géocodage. Lorsqu'il était impossible de déterminer l'IQ, la lettre « N », correspondant à « inconnu », a été utilisée. On attribue un « NNN » aux fins de l'IQ à des enregistrements géocodés à la main ou dont la conversion a été effectuée directement des géocodes du Recensement de 2001.

Tous les efforts ont été déployés pour s'assurer que la valeur installation de livraison (BP) indique si un code postal de CPgenre 3 ou 5 a été codé selon une installation postale ou selon un secteur de service desservi par le code postal. À l'occasion, un enregistrement de CPgenre 3 ou 5 peut être codé selon une installation postale (désignée par BP = « 1 » dans un enregistrement) et selon un secteur de service (désigné par BP = « 0 » dans un enregistrement). Dans certains cas, y compris lorsque les appariements à une région géographique reposaient directement sur la conversion faite des géocodes du Recensement de 2001, la BP était inconnue (ce qui était indiqué par BP = « 2 »).