5. Qualité des données

Passer au texte

Historique
Précision de localisation
Précision des attributs
Cohérence logique
Uniformité avec d'autres produits
Intégralité

Début du texte

L'appariement des éléments composant la qualité des données ont pour objet de déterminer dans quelle mesure les données conviennent à un usage particulier en décrivant pourquoi, quand et comment elles ont été produites et en indiquant leur degré d'exactitude. Ces éléments de qualités comprennent un aperçu portant sur l'historique, la précision de localisation, la précision des attributs, la cohérence logique et l'intégralité. Ces renseignements sont fournis aux utilisateurs pour tous les appariements des produits de données.

Historique

L'historique de l'appariement des données comprend une description des documents de référence à partir desquels les données ont été extraites ainsi que des méthodes utilisées, y compris la date des documents de référence et les transformations effectuées en vue de la production de la version définitive des fichiers numériques.

Le Fichier de conversion des codes postauxMO (FCCP) est le résultat de deux mises à jour. Une première est menée tous les cinq ans, après chaque recensement, pour aligner la base de données en fonction des régions géographiques de recensement le plus récent. L'autre activité d'actualisation consiste dans les activités de maintien continues qui permettent d'apparier les codes postauxMO les plus récents de la Société canadienne des postes (SCP) aux unités géographiques de recensement. Ces liens sont enregistrés sur la base de données des codes postauxMO de la Division des registres statistiques et de la géographie.

Appariement des régions géographiques du Recensement de 2011

Documents de base

Les documents de base utilisés pour mettre à jour les liens géographiques du recensement de 2006 à 2011 étaient :

  • mises à jour mensuelles du fichier Recherche d'adresses, du fichier des modes de livraison selon le code postalMO et du fichier sur les chefs de ménage de la SCP
  • Infrastructure des données spatiales (IDS) de la Division des registres statistiques et de la géographie
  • Recensement de population et des logements de 2011
  • le fichier des données des côtés d'îlot, des îlots de diffusion et des points représentatifs du Recensement de 2011
  • fichier de correspondance des aires de diffusion

Procédures

La méthode appliquée pour effectuer le rapprochement entre les régions géographiques du Recensement de 2011 et le FCCP peut se résumer ainsi :

  1. Traitement de l'information contenue dans les fichiers de la SCP
  2. Géocodage automatisé des codes postauxMO aux côtés d'îlot, aux îlots de diffusion ou aux aires de diffusion du Recensement de 2011
  3. Attribution des aires de diffusion du Recensement de 2011 aux codes postauxMO en utilisant la correspondance entre les régions géographiques du Recensement de 2006 et du Recensement de 2011
  4. Géocodage manuel des codes postauxMO
  5. Vérification par échantillonnage des enregistrements des codes postauxMO
  6. Attribution d'un indicateur de lien unique (ILU)
  7. Associer les niveaux de géographie supérieurs.

1re étape : Traitement de l'information contenue dans les fichiers de la SCP

Les fichiers envoyés chaque mois par la SCP sont traités afin que soient attribués une date de création, une date de retrait, un mode de livraison historique (H_ML) et un mode de livraison (ML). Les enregistrements sont extraits du fichier Recherche d'adresses de la SCP avec le code postalMO, le genre de code postalMO (CPgenre) et l'ensemble des données connexes sur l'adresse. La date de création est la date à laquelle le code postalMO a été activé. La date de retrait est la date à partir de laquelle le code postalMO a été supprimé des fichiers mensuels de la SCP. Le mode de livraison est attribué au moyen du fichier des modes de livraison. Lorsque le ML d'un code postalMO est mis à jour, le ML précédent devient le H_ML. On attire l'attention des utilisateurs sur le fait que certains codes postauxMO sont retirés puis réintroduits à une date ultérieure et qu'il est possible qu'ils soient réactivés à un autre emplacement.

2e étape : Géocodage automatisé des codes postauxMO aux côtés d'îlot, aux îlots de diffusion ou aux aires de diffusion du Recensement de 2011

Tous les codes postauxMO valides en novembre 2014 sont géocodés au moyen d'un système de géocodage automatisé. Une discussion approfondie à propos de l'approche en matière de géocodage est présentée dans le document de travail intitulé Mise en correspondance des codes postaux et des régions géographiques (n° 92F0138MIF2007001 au catalogue), disponible sur le site Web de Statistique Canada.

Le système utilise le fichier du secteur de recherche de la région de tri d'acheminement© (RTA©) ainsi qu'une correspondance entre la collectivité de la SCP et la subdivision de recensement (SDR) pour définir le secteur général à l'intérieur duquel on trouvera le code postalMO. Les réponses au recensement sont utilisées pour créer des secteurs de recherche des RTA©. Ces secteurs de RTA© rassemblent les aires de diffusion dans lesquelles une RTA© particulière a été déclarée lors du Recensement de 2011. Les correspondances entre les « municipalités » de Postes Canada et les subdivisions du Recensement de 2011 sont établies à l'aide de la province de la municipalité et de l'analogie dans le nom. Lorsque la correspondance n'est pas clairement établie, les anciens fichiers des SDR de l'Infrastructure des données spatiales (IDS) sont utilisés pour établir la correspondance.

Les codes postauxMO attribués à des tranches d'adresses municipales (CPgenre 1 et 2) sont codés dans l'IDS pour être appariés à l'aire de diffusion, à l'îlot de diffusion ou au côté d'îlot approprié. Environ 97 % des enregistrements de code postalMO de CPgenre 1 et 2 du FCCP de novembre 2014 étaient géocodés ainsi.

Dans le Recensement de 2011, la réponse au code postalMO est utilisée pour le codage des routes rurales, des boîtes des installations postales et des bureaux de poste et des codes postauxMO qui desservent des secteurs de service généraux. Ces codes postauxMO sont géocodés au niveau de l'aire de diffusion (AD). Un procédé postal visant à éliminer toute répétition dans l'attribution des AD réduit le nombre d'AD appariées. Toutefois, tous les codes postauxMO actifs ne sont pas géocodés de cette façon, soit parce que les données concernant l'adresse sont introuvables soit parce que la réponse de recensement n'est pas suffisamment significative (au moins quatre réponses pour un même code postalMO par îlot de diffusion) pour permettre de déterminer le secteur de géocodage pertinent.

Un indicateur de qualité (IQ) est attribué au cours du processus de géocodage automatisé. L'indicateur est établi en fonction de la fiabilité de l'appariement entre un code postalMO et une région géographique. Se reporter à la section des Spécifications techniques pour plus de détails.

3e étape : Attribution des aires de diffusion du Recensement de 2011 aux codes postauxMO en utilisant la correspondance entre les régions géographiques du Recensement de 2006 et du Recensement de 2011

Lorsque le système automatisé de jumelage des adresses ne permet pas d'établir une correspondance, les codes postauxMO qui étaient imputés précédemment à une région géographique du Recensement de 2006 sont appariés à une région géographique du Recensement de 2011 au moyen de la correspondance entre les régions géographiques des recensements de 2006 et 2011. Ces appariements sont créés uniquement au niveau des AD du Recensement de 2011.

4e étape : Géocodage manuel des codes postauxMO

Lorsque le processus automatisé ne permet pas de les coder à un niveau de précision acceptable ou s'il est impossible de les convertir au moyen de la correspondance établie entre les régions géographiques des recensements de 2006 et de 2011, les codes postauxMO doivent être géocodés manuellement.

Dans les régions adressables couvertes par l'Infrastructure des données spatiales (IDS), on tente de relier les codes postauxMO à un ou plusieurs côtés d'îlot. La liste des enregistrements des nouveaux codes postauxMO et des tranches d'adresses de la SCP est appariée aux répertoires des rues de l'IDS à partir de certains éléments communs aux deux fichiers (par exemple, la province, la municipalité, le nom de la rue, le type de rue, l'orientation de la rue et la tranche d'adresses). Une fois l'appariement réalisé, le code postalMO et les codes de la région géographique correspondants sont transférés à la base de données des codes postauxMO.

5e étape : Vérification par échantillonnage des enregistrements des codes postauxMO

La relation établie entre le code postalMO, les îlots de diffusion et les aires de diffusion est validée par échantillonnage des enregistrements réalisé à partir du géocodage effectué lors des processus décrits ci-dessus. Ces enregistrements sont géocodés manuellement de façon indépendante. Les deux séries de géocodes sont comparées dans le cadre de la vérification.

6e étape : Attribution d'un indicateur de lien unique (ILU)

Un bon nombre de codes postauxMO comprennent des enregistrements multiples dans le FCCP. Un indicateur de lien unique (ILU) est créé afin de permettre aux utilisateurs d'exploiter plus facilement les codes postauxMO comprenant des enregistrements multiples. L'ILU fournit un enregistrement géographique pour cartographier le point représentatif d'un code postalMO. L'indicateur de lien unique a une valeur de « 1 » afin de repérer le meilleur (ou le seul) lien pour un code postalMO donné. La valeur « 0 » indique un enregistrement supplémentaire.

Soulignons que l'indicateur de lien unique est indiqué tant sur les codes postauxMO actifs que retirés. Lorsqu'ils utiliseront des codes postauxMO actifs et retirés, les utilisateurs verront que plusieurs ILU s'affichent dans le cas d'un code postalMO retiré et réactivé. Toutefois, il n'y aura qu'un seul ILU pour une série d'enregistrements actifs pour un code postalMO.

Lorsque nous attribuons l'ILU, la priorité est accordée aux codes postauxMO correspondant à des adresses civiques ou à des logements (en fonction du CPgenre). La fiabilité du codage de la région géographique (indicateur de qualité) et la précision du géocodage (côté d'îlot, aire de diffusion ou îlot de diffusion), ainsi que la population, sont prises en compte. Lorsque le code postalMO est apparié à une AD elle-même associée à plusieurs unités comme une circonscription électorale fédérale (CEF), un centre de population (CTRPOP) ou une localité désignée (LD), l'ILU est alors attribué à l'enregistrement qui représente la plus grande population, que ce soit au niveau de la CEF, du CTRPOP ou de la LD.

Les utilisateurs doivent faire preuve de prudence lorsqu'ils ont recours à l'ILU, puisque la correspondance obtenue entre le code postalMO et les autres unités géographiques ne sera que partielle.

7e étape : Associer les niveaux de géographie supérieurs

On désigne les niveaux de géographie supérieurs en fonction de l'identificateur unique du côté d'îlot, d'îlot de diffusion et d'aire de diffusion. Pour obtenir une vue d'ensemble des relations entre les unités géographiques, consulter le tableau de hiérarchie des unités géographiques à l'Annexe B. Lorsqu'une aire de diffusion est associée à plus d'une CEF, CTRPOP ou LD, l'appariement de ce code postalMO à des aires de diffusion fera l'objet de plus d'un enregistrement au FCCP.

Précision de localisation

La précision de localisation représente la précision absolue et relative de la localisation des caractères géographiques. La précision absolue s'entend du degré de correspondance entre les coordonnées figurant dans l'ensemble de données et les vraies valeurs ou celles acceptées comme telles. La précision relative s'entend du degré de correspondance entre la localisation relative des caractères et leur vraie localisation relative ou celle acceptée comme telle. Les énoncés relatifs à la précision de localisation font état de la qualité du fichier ou du produit final après toutes les transformations dont il a fait l'objet.

Les coordonnées géographiques associées aux codes postauxMO correspondent aux points représentatifs du côté d'îlot, de l'îlot de diffusion, ou de l'aire de diffusion calculés aux fins du recensement. Ainsi, la précision de localisation des codes postauxMO dépend :

  • de la précision de l'appariement entre le code postalMO et le côté d'îlot, l'îlot de diffusion ou l'aire de diffusion
  • de la précision de localisation des points représentatifs du côté d'îlot, de l'îlot de diffusion et de l'aire de diffusion vis-à-vis les côtés d'îlots, les îlots de diffusion et les aires de diffusion en question.

Le degré de précision des liens contenus dans le FCCP varie en fonction des différentes méthodes utilisées pour obtenir ces liens. Les appariements au niveau du côté d'îlot sont jugés les plus précis étant donné l'utilisation des tranches d'adresses fournies par la SCP pour les localiser. Lorsque l'appariement à un côté d'îlot n'a pas être établi, le code postalMO était apparié à un îlot de diffusion ou une aire de diffusion.

Le tableau 5.1 illustre le plus bas niveau auquel les codes postauxMO associés aux tranches d'adresses (CPgenre 1 et 2) ont été géocodés.

Tableau 5.1
Codes postauxMO géocodés de types CPgenre 1 et 2 – actif en novembre 2014
Sommaire du tableau
Le tableau montre les résultats de Tableau 5.1 Codes postaux géocodés de types CPgenre 1 et 2 – actif en novembre 2014. Les données sont présentées selon Géocodage des enregistrements (titres de rangée) et Enregistrements et Codes postaux associés aux enregistrements(figurant comme en-tête de colonne).
Géocodage des enregistrements Enregistrements Codes postauxMO associés aux enregistrements
nombre pourcentage nombre pourcentage
Géocodé au côté d'îlot 1 467 337 84,98 756 495 87,54
Géocodé à l'îlot de diffusion 160 552 9,30 65 631 7,59
Géocodé à l'aire de diffusion 92 323 5,35 36 910 4,27
Géocodé à la subdivision de recensement 6 434 0,37 5 151 0,60
Total 1 726 646 100,00 864 187 100,00

L'indicateur de qualité (IQ) illustre la fiabilité du lien établi entre le code postalMO et la région géographique plus précise pour chaque enregistrement géocodé à l'aide du système automatisé. Pour obtenir de plus amples renseignements sur l'indicateur de qualité, voir la section des Spécifications techniques.

Les coordonnées géographiques comprises dans le FCCP sont tirées de l'Infrastructure des données spatiales (IDS) de Statistique Canada. Les utilisateurs doivent être conscients qu'une précision de localisation absolue ne représente pas une caractéristique recherchée par l'IDS. Par conséquent, ces fichiers et tous les sous-produits dérivés ne sont pas recommandés pour les applications légales ou reliées à l'ingénierie ou pour la répartition des services d'urgence.

Pour plus de renseignements sur la méthode utilisée dans le calcul des points représentatifs des côtés d'îlot, des îlots de diffusion et des aires de diffusion, voir la section des Spécifications techniques.

Précision des attributs

Par précision des attributs, on entend la précision des données quantitatives et qualitatives reliées à chaque caractère (tels que la population pour un centre de population, le nom de rue, le nom et le code de la subdivision de recensement).

Le FCCP est un fichier non hiérarchique qui offre les attributs des codes postauxMO et des aires de diffusion et des îlots de diffusion, etc. appariés à ces codes postauxMO. La plupart de ces attributs proviennent de deux sources indépendantes. Quelques attributs ont aussi été créés pour les besoins du FCCP.

Le code géographique, le type et le nom de toutes les régions géographiques normalisées supérieures auxquels un côté d'îlot, un îlot de diffusion ou une aire de diffusion est attribué sont extraits de l'Infrastructure des données spatiales.

Les renseignements relatifs au code postalMO – date de création, date de retrait, type de mode de livraison, genre de code postalMO et nom de la communauté (SCP) – sont tirés de la base de données des codes postauxMO et des tranches d'adresses de la SCP. Dans certains cas, le genre de code postalMO a été imputé par Statistique Canada (voir la section des Spécifications techniques).

L'indicateur de lien unique (ILU; voir Procédures) et le type de point représentatif sont des attributs créés par Statistique Canada.

Des tests sont exécutés pour s'assurer que certaines relations de données de base sont uniformes à l'ensemble d'enregistrements dans le FCCP.

Cohérence logique

La cohérence logique décrit la fidélité des relations encodées dans la structure de l'appariement des données numériques.

Dans certains cas, surtout dans les régions rurales, la zone de service associée à un code postalMO croise les limites des aires de diffusion. En pareil cas, le même code postalMO peut être répété à deux ou à plusieurs reprises en étant apparié à des renseignements géographiques différents (c'est-à-dire des coordonnées géographiques ou des codes d'aire de diffusion différents). Ces enregistrements multiples reflètent le lien entre le code postalMO et les unités géographiques du recensement. Un code postalMO peut aussi être apparié à plus d'un côté d'îlot ou îlot de diffusion à l'intérieur d'une même aire de diffusion.

À l'inverse, il peut arriver que des codes postauxMO distincts soient associés aux mêmes coordonnées. Cela se produit lorsque plus d'un code postalMO est apparié à la même aire de diffusion. Plus d'un code postalMO peut également être apparié à un seul côté d'îlot ou îlot de diffusion.

Chaque ensemble d'enregistrements actifs associé à un code postalMO comporte un ILU équivalant à « 1 ». Chaque ensemble d'enregistrements retirés associé à un code postalMO, selon une date de retrait donnée, comporte un ILU équivalant à « 1 ».

Uniformité avec d'autres produits

Les données présentées dans le FCCP sont cohérentes avec l'ensemble des produits géographiques reliés au Recensement de 2011, sauf le Fichier des limites des régions de tri d'acheminement du Recensement de 2011 (no 92-179-X au catalogue), qui représente seulement les régions de tri d'acheminement© inscrits par les ménages au Recensement de 2011. Le FCCP comprend l'ensemble des codes postauxMO (à la fois actifs et retirés) et est mis à jour annuellement pour tenir compte des nouveaux codes postauxMO.

Intégralité

L'intégralité indique dans quelle mesure les traits géographiques, leurs attributs et leurs relations sont inclus dans l'ensemble de données ou en sont omis. Elle comprend aussi des renseignements sur les critères de sélection, les définitions utilisées et les autres règles cartographiques pertinentes.

Dans le contexte du FCCP, l'intégralité correspond à la mesure selon laquelle tous les codes postauxMO valides sont intégrés au FCCP et tous les codes des unités géographiques du Recensement de 2011 sont appariés à un code postalMO. La plupart des codes postauxMO valides, en date de novembre 2014 selon la SCP, sont appariés à une unité géographique du recensement.

Il y aussi 5 246 codes postauxMO retirés qui sont inclus dans le FCCP. Les codes postauxMO retirés avant le 1er janvier 2011 sont inclus dans le fichier Retiré 2010 (R2010.txt). Le fichier Retiré 2010 contient 66 102 codes postauxMO retirés.

L'indicateur de qualité (IQ) n'est en ce moment disponible que pour les enregistrements traités au moyen du processus de géocodage automatisé. Lorsque les codes postauxMO étaient géocodés selon les renseignements relatifs à l'adresse, chacun des trois caractères de l'IQ comportait les lettres « A », « B » ou « C », une indication de la fiabilité du géocodage. Lorsqu'il était impossible de déterminer l'IQ, la lettre « N », correspondant à « inconnu », a été utilisée. On attribue un « NNN » aux fins de l'IQ à des enregistrements géocodés à la main ou dont la conversion a été effectuée directement des géocodes du Recensement de 2006.

Tous les efforts ont été déployés pour s'assurer que la valeur installation de livraison (BP) indique si un code postalMO de CPgenre 3 ou 5 a été codé selon une installation postale ou selon un secteur de service desservi par le code postalMO. À l'occasion, un enregistrement de CPgenre 3 ou 5 peut être codé selon une installation postale (désignée par BP = « 1 » dans un enregistrement) et selon un secteur de service (désigné par BP = « 0 » dans un enregistrement). Dans certains cas, y compris lorsque les appariements à une région géographique reposaient directement sur la conversion faite des géocodes du Recensement de 2006, la BP était inconnue (ce qui était indiqué par BP = « 2 »).

Date de modification :