Statistique Canada - Gouvernement du Canada
Accessibilité : Renseignements générauxÉviter tous les menus et aller au contenu.Accueil - Logo de Statistique Canada Éviter le menu principal et aller au menu secondaire. English 1 de 5 Contactez-nous 2 de 5 Aide 3 de 5 Recherche site web 4 de 5 Site du Canada 5 de 5
Éviter le menu secondaire et aller au menu des rubriques. Le quotidien 1 de 7
Recensement 2 de 7
Le Canada en statistiques 3 de 7 Profils des communautés 4 de 7 Nos produits et services 5 de 7 Accueil 6 de 7
Autres liens 7 de 7

Avertissement Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Éviter le menu du rubriques et aller au contenu.

Discussion

Résumé
Introduction
Typologie des codes postaux et localisation
Utilisateurs des codes postaux et géographie
Règles de géocodage et mesures de la qualité
Conclusion

Résumé

Statistique Canada crée des fichiers qui fournissent le couplage entre les codes postaux et les régions géographiques selon lesquelles les données statistiques sont diffusées. En couplant les codes postaux et ses régions géographiques, Statistique Canada facilite l'extraction et l'agrégation subséquente de données pour certaines régions géographiques de fichiers mis à la disposition des utilisateurs. Les utilisateurs peuvent alors totaliser les données de Statistique Canada pour leurs régions et d'autres données pour ces mêmes régions de manière à établir un profil statistique combiné de ces régions.

La méthodologie utilisée par Statistique Canada pour le couplage des codes postaux et des régions géographiques a été questionnée. Pour régler la situation, Statistique Canada a décidé de créer un cadre conceptuel pour l'élaboration des règles régissant le couplage des codes postaux et des régions géographiques de Statistique Canada. Le présent document de travail expose le cadre conceptuel et les règles de géocodage. La méthodologie qui y est décrite servira de fondement pour le couplage des codes postaux aux régions géographiques du Recensement de 2006. Les utilisateurs des produits de Statistique Canada qui font appel aux codes postaux sont invités à formuler des commentaires sur le présent document.

Introduction

Le présent document comporte deux objectifs : 1) établir un cadre conceptuel définissant le rapport entre les codes postaux et les régions géographiques; et 2) définir par la suite des règles pour le couplage des codes postaux et des régions géographiques normalisées1.

Les codes postaux sont gérés par la Société canadienne des postes (SCP) et servent au tri et à la livraison efficace du courrier. Ils ne sont pas créés comme unités pour l'analyse ou la mise en correspondance de caractéristiques de populations, d'entreprises ou de logements. Les produits fondés sur les codes postaux créés par Statistique Canada servent de lien entre les codes postaux et les régions géographiques normalisées, afin de permettre diverses utilisations des données. De façon générale, les utilisations des produits fondés sur les codes postaux peuvent être caractérisées de la façon suivante :

  1. association des codes postaux et des régions géographiques normalisées (pour l'extraction de données, la mise en correspondance, l'établissement de profils et/ou l'analyse);
  2. la sélection d'unités statistiques selon les régions géographiques normalisées pour l'échantillonnage, les études de marché, etc.

Unité statistique

Une unité statistique est l'unité d'observation ou de mesure pour laquelle des données sont recueillies ou calculées. L'unité statistique de base pour les statistiques sociales est la personne, qui sert d'unité d'analyse dans le cadre de la plupart des programmes de statistiques sociales. Parmi les autres unités utilisées dans les statistiques sociales figurent le logement et le ménage.

L'association entre les codes postaux et les régions géographiques normalisées est actuellement comprise dans les produits suivants : 1) le Fichier de conversion des codes postaux (FCCP) et 2) le Fichier des codes postaux par circonscriptions électorales fédérales (FCPCÉF). Le FCCP permet d'assurer le couplage des codes postaux et de la plupart des régions géographiques normalisées, y compris les entités détaillées suivantes : côté d'îlot, îlot de diffusion et aire de diffusion. Le FCCP est le principal produit répondant aux exigences des applications mentionnées précédemment.

Au fil des ans, un certain nombre de problèmes se sont posés relativement à la qualité du FCCP, ce qui a entraîné la remise en question des concepts fondamentaux qui sous­tendent la façon dont les codes postaux sont couplés aux régions géographiques normalisées. Il s'agit de problèmes comme l'utilisation appropriée des données pour le couplage des codes postaux, la précision et l'exactitude des couplages, et l'attribution d'indicateurs de lien unique.  Le suivi de ces problèmes de qualité du FCCP a fait augmenter les coûts déjà élevés du géocodage des codes postaux. Ces problèmes ont fait ressortir la nécessité d'examiner et d'établir un cadre conceptuel définissant le rapport entre les codes postaux et les régions géographiques normalisées, en vue de rétablir les règles opérationnelles servant au couplage des codes postaux et des régions géographiques normalisées, ainsi qu'à l'élaboration subséquente des produits.

Le couplage des codes postaux et des régions géographiques a posé des difficultés dans les cas suivants :

  • Il n'existait pas de rapport explicite entre le nom de municipalité/collectivité de code postal dans les fichiers de la SCP et les régions géographiques normalisées. Ce rapport a, à l'occasion, fait l'objet d'erreurs d'interprétation qui ont entraîné des couplages incorrects.
  • Étant donné que les empreintes géographiques types des différents genres de codes postaux n'étaient pas bien comprises, les codes postaux ont parfois été couplés à un trop grand nombre (ou un trop petit nombre) de régions géographiques, ce qui a entraîné un surdénombrement (ou un sous‑dénombrement).
  • Dans certains cas, le surdénombrement mentionné précédemment a fait en sorte qu'un code postal a été couplé à un trop grand nombre de petites régions géographiques (comme des îlots), ce qui implique que le niveau de précision était inapproprié.

Le présent document de travail repose sur l'hypothèse selon laquelle une meilleure utilisation des données sur les codes postaux recueillies dans le cadre du recensement ainsi que des données des fichiers de la SCP contribuera à résoudre les problèmes décrits précédemment et permettra d'obtenir des couplages plus précis entre les codes postaux et les régions géographiques normalisées.

Des règles doivent être élaborées pour géocoder les codes postaux selon les régions géographiques normalisées de Statistique Canada, afin d'améliorer le couplage.  Le géocodage peut être défini comme le processus d'attribution d'identificateurs géographiques (codes), en vue de la mise en correspondance des traits physiques et des enregistrements de données. Les codes géographiques en résultant permettent le couplage géographique des données. Par exemple, l'une des façons de géocoder une adresse municipale au Canada consiste à localiser d'abord la région générale, puis l'immeuble particulier comportant cette adresse municipale. Étant donné que les mêmes noms de rue ou adresses municipales peuvent se retrouver dans de nombreuses régions au Canada, il est essentiel de pouvoir limiter la recherche d'une combinaison de nom de rue et d'adresse municipale à un lieu particulier au Canada. Le terme « secteur de recherche » sera utilisé dans le présent document pour désigner la région géographique à l'intérieur de laquelle le géocodage peut être effectué à partir des noms de rue et des adresses municipales. Le processus de géocodage d'une adresse municipale peut par conséquent être décrit de la façon suivante :

Étape 1 :

Établir le secteur de recherche.

Étape 2 :

Trouver le secteur de recherche dans le Fichier du réseau routier.

Étape 3 :

Trouver la rue dans le secteur de recherche du Fichier du réseau routier.

Étape 4 :

Trouver l'adresse dans une tranche d'adresses d'une rue.

Étape 5 :

Établir les codes géographiques.

(Les codes géographiques utilisés sont le côté d'îlot, l'îlot de diffusion et l'aire de diffusion.)

Le processus de géocodage décrit précédemment servira de modèle général pour établir les règles opérationnelles de géocodage des codes postaux. Le processus de géocodage des codes postaux permet ultimement de créer le lien entre les codes postaux et les codes géographiques, soit le côté d'îlot, l'îlot de diffusion et l'aire de diffusion. Le lien entre les codes postaux et toutes les autres régions géographiques normalisées est fondé sur ce géocodage initial.

Le présent document de travail vise les objectifs suivants :

  1. Étudier les concepts et les descripteurs de codes postaux utilisés par la Société canadienne des postes, du point de vue de leur typologie et de leur occurrence, à titre de première étape en vue de comprendre la façon dont les codes postaux sont mis à la disposition des utilisateurs. Cette étude fait partie de la section 1.
  2. Examiner comment les codes postaux sont utilisés et élaborer des secteurs de service de code postal fondés sur les modèles d'utilisation, afin que ces secteurs de service puissent servir comme secteurs de recherche pour le géocodage. Cette étape est comprise dans la section 2.
  3. Établir les règles opérationnelles régissant le géocodage ou le couplage des codes postaux et des régions géographiques normalisées, et fournir des indicateurs de la qualité des données et d'autres métadonnées. Cette étape est comprise dans la section 3.

On s'attend à ce que les règles de géocodage et les recommandations d'indicateurs de la qualité puissent être utilisées pour créer les produits.

1.0 Typologie des codes postaux et localisation

L'examen de la structure et de la typologie des codes postaux constitue la première étape en vue de comprendre comment ils peuvent être liés à des régions géographiques normalisées. Certaines des définitions pertinentes, de même que les types et les occurrences, sont examinées dans la présente section. Cela sert de base aux règles opérationnelles de géocodage des codes postaux (voir la section 3.0).

1.1 Le code postal et la localisation

Les codes postaux sont gérés par la SCP. Ils ont été conçus pour aider à trier rapidement le courrier et à assurer la livraison plus efficace des lettres, colis et autres envois par la SCP. Un code postal peut être lié à différents types de points de livraison, y compris des boîtes aux lettres résidentielles, des boîtes postales multiples, ainsi que des cases postales de bureaux de poste (voir www.postescanada.ca).

Les caractères qui constituent le code postal sont généralement représentatifs de l'utilisation prévue (livraison) du code postal. La Société canadienne des postes définit un code postal de la façon suivante :

Une combinaison alphanumérique de six caractères (ANA NAN) attribuée à une ou plusieurs adresses postales. Le code postal fait partie intégrante de toutes les adresses postales au Canada et est nécessaire pour le traitement mécanisé du courrier. Les codes postaux servent aussi à identifier les diverses installations de traitement et de livraison de la SCP (Société canadienne des postes, 2005a, page 30).

Les trois premiers caractères du code postal (combinaison alphanumérique de « ANA ») correspondent à la région de tri d'acheminement (RTA). Cette dernière est définie de la façon suivante :

La région de tri d'acheminement ou RTA représente une zone précise au sein d'une province ou d'une zone géographique importante. La région de tri d'acheminement constitue le fondement du tri primaire du courrier d'acheminement (Société canadienne des postes, 2007, section B, Chapitre 3, page 8).

Les trois derniers caractères du code sont appelés unité de distribution locale (UDL). Ils permettent la création de codes postaux individuels à l'intérieur du secteur de service de la RTA.

Chacune des premières lettres du code postal est réservée à une province/un territoire particulier du pays (voir l'annexe A pour plus de détails). De façon plus particulière, selon les dossiers de la SCP, le premier caractère correspond à la province/au territoire de l'installation de livraison à partir de laquelle le service lié au code postal est assuré. Le deuxième caractère du code postal correspond à la couverture de ce code. Un code postal comportant un « 0 » comme deuxième caractère est classé comme « rural », et tous les autres codes postaux sont considérés comme urbains par la Société canadienne des postes2. Toutefois, cela ne signifie pas que le code postal correspond aux « régions rurales » ou « régions urbaines » définies selon les chiffres de population du recensement courant3,4. Ils peuvent être désignés comme des codes postaux desservant des secteurs de livraison rurale et des secteurs de livraison urbaine, afin d'éviter la confusion avec les termes « régions rurales » et « régions urbaines » utilisés par Statistique Canada. Par exemple, le Nouveau­Brunswick ne compte aucun secteur de livraison rurale, même si Statistique Canada considère cette province comme rurale pour une large part. Dans le cas des codes postaux liés à des secteurs de livraison rurale, le Guide des postes du Canada indique ce qui suit : « … lorsqu'ils sont combinés à la région de tri d'acheminement, les trois derniers caractères désignent une collectivité rurale précise » (Société canadienne des postes, 2007, section B, chapitre 3, page 10). Les collectivités doivent être localisées sur une carte, afin de pouvoir être géocodées selon les régions géographiques normalisées.

Des cartes sont disponibles auprès de la SCP et correspondent au secteur représenté par une RTA. Toutefois, les personnes vivant dans une province peuvent utiliser un code postal lié à une autre province, et les personnes vivant dans une RTA peuvent utiliser le code postal d'une autre RTA. Cela signifie que le secteur desservi par le code postal ou la RTA peut être différent des limites administratives créées par la Société canadienne des postes. En outre, l'échelle de ces cartes (1:50 000 à 1:12 000 000) rend difficile le lien entre les limites des RTA et le réseau routier plus détaillé du cadre géographique de Statistique Canada. Même si ces cartes sont utiles pour la localisation de la RTA à l'intérieur d'une province, elles ne nous renseignent pas sur la portée de la RTA en rapport avec un réseau routier disponible dans le public, et ne comprennent pas non plus les renseignements plus détaillés nécessaires pour le géocodage des codes postaux. Toutefois, les cartes des itinéraires de facteurs (IF) disponibles récemment sur Internet (généralement pour les secteurs de livraison urbaine) présentent les limites des RTA dans le contexte du réseau routier. Elles peuvent être plus utiles que les cartes des RTA pour déterminer les limites de nombreuses RTA. Toutefois, elles ne permettent pas de délimiter le secteur desservi par un code postal.

Le code postal proprement dit n'est pas suffisant pour déterminer l'emplacement exact et la couverture du secteur de service. La RTA peut être utilisée pour localiser le secteur général desservi par les codes postaux pertinents. Des renseignements provenant d'autres sources sont nécessaires pour associer le code postal et des régions géographiques normalisées particulières.

1.2 Données sur les adresses et la livraison tirées des fichiers de la SCP

La SCP fournit des renseignements sur les codes postaux dans le contexte des différents aspects de la livraison du courrier. Ces renseignements sont pertinents du point de vue de la façon dont ces codes postaux se rejoignent géographiquement et dont ils peuvent être consultés par les personnes et les institutions qui utilisent le système postal. Les typologies et les données de localisation décrites dans le présent document sont tirées des données fournies sur une base mensuelle par la SCP à Statistique Canada, dans les fichiers suivants.

  1. Fichier Recherche d'adresses
    Ce fichier comprend tous les codes postaux actifs et toutes les adresses postales valides au pays (Société canadienne des postes, 2005a). Une version mise à jour de ce fichier est disponible sur une base mensuelle auprès de la SCP, et elle comprend tous les codes postaux qui sont considérés comme « actifs » pour le service postal à ce moment­là. Environ 97 % des codes postaux du fichier sont liés à la livraison à une adresse municipale5. Ces codes postaux peuvent être associés à plus d'un enregistrement de tranche d'adresses dans le fichier. Ces enregistrements comprennent un nom de collectivité utilisé par la SCP, un nom de rue et une tranche d'adresses municipales. (Les différents types d'enregistrements compris dans le Fichier Recherche d'adresses et le nom de collectivité de la SCP sont décrits dans la section 1.3.)
  2. Fichier sur les chefs de ménage
    Ce fichier est conçu pour fournir des renseignements sur le nombre de logements et d'entreprises desservis par les installations de livraison. Il comprend toutes les installations de livraison rurales et urbaines au Canada (Société canadienne des postes, 2005b). Il comprend en outre les adresses de certaines de ses installations. Ces adresses peuvent être utiles pour le géocodage des codes postaux en fonction des installations dont ils relèvent. (L'utilisation du Fichier sur les chefs de ménage est abordée à la section 1.4.)
  3. Fichier sur les modes de livraison
    Ce fichier comprend les codes postaux et les modes de livraison s'y rapportant (Société canadienne des postes, 2005c). Il indique si la livraison est faite à une tranche d'adresses municipales, à un immeuble commercial ou à une case postale de bureau de poste. (Les types de mode de livraison sont abordés de façon plus détaillée à la section 1.5.)

Il s'agit des trois fichiers les plus pertinents pour le géocodage des codes postaux. Parmi eux, le Fichier Recherche d'adresses, qui comprend les données sur les adresses liées à la grande majorité des codes postaux, est le plus utile pour le géocodage.

1.3 Fichier Recherche d'adresses

Le Fichier Recherche d'adresses fournit un tableau complet des codes postaux actifs (y compris les mises à jour et les 500 à 2 500 nouveaux codes postaux adoptés ou « créés » chaque mois). Parmi les 1 144 108 enregistrements figurant dans le Fichier Recherche d'adresses de juin 2006, 1 133 814 étaient « actifs » ou valides pour le service postal. Les autres codes postaux du fichier sont ceux qui sont « retirés » au cours du mois en question. Statistique Canada utilise le terme « code postal retiré » pour décrire tous les codes postaux qui étaient actifs à un moment donné, mais ne le sont plus. Même si la Société canadienne des postes considère uniquement les codes postaux actifs comme valides pour le service postal, les codes postaux retirés peuvent être utilisés un certain temps après leur retrait.

Nom de collectivité de la SCP dans le Fichier Recherche d'adresses

L'identification de la municipalité desservie par un code postal constitue une étape initiale importante pour déterminer avec précision où le code postal devrait être géocodé. Le premier caractère du code postal (qui indique la province ou le territoire), combiné au nom de collectivité de la SCP permet parfois, mais pas toujours, de repérer la municipalité ou la subdivision de recensement (SDR) à partir de laquelle le code postal peut être géocodé. Lorsque la SDR peut être localisée, les données sur l'adresse municipale peuvent servir au géocodage en fonction d'une tranche d'adresses municipales.

Le terme « municipalité » dans le Fichier Recherche d'adresses ne correspond pas nécessairement à la municipalité définie par la loi au moment où la Société canadienne des postes publie les données. Il s'agit de noms utilisés au niveau local, afin de prévenir la confusion en ce qui a trait au secteur desservi. Le secteur desservi ne coïncide pas nécessairement avec les municipalités légalement constituées ayant le même nom ou un nom similaire. Par exemple, lorsque des municipalités sont fusionnées, la Société canadienne des postes préserve les anciens noms (avant la fusion), jusqu'à ce qu'elle puisse établir que les différentes rues comportent un nom unique dans la nouvelle municipalité fusionnée. La RTA est aussi définie en rapport avec une municipalité de la façon suivante :

La RTA comprend les trois premiers caractères d'un code postal. La RTA qualifie la zone, à l'intérieur d'une municipalité, qui est autorisé à utiliser le nouveau nom valide de municipalité (Société canadienne des postes, 2005a, page 33).

Ces noms de municipalités sont souvent des noms de lieux qui n'existent plus ou des noms couramment utilisés en rapport avec ces localités. Afin d'éviter toute confusion, on utilisera ci­après le terme « collectivité de la SCP ».

La comparaison des noms de municipalités utilisés en janvier 2001 illustre ce point. Les SDR de Statistique Canada comprennent toutes les municipalités définies par la loi qui existaient en date du 1er janvier de l'année du recensement (2001). Une comparaison des noms de collectivité de la SCP existants montre que moins de 40 % d'entre eux correspondent aux SDR. Le tableau qui suit illustre les appariements de noms de collectivités de la SCP et de noms de SDR de 20016 :

Tableau 1 Appariement des noms de collectivités de la Société canadienne des postes et des noms des subdivisions de recensement (SDR) du Recensement de 2001. Une nouvelle fenêtre s'ouvrira.

Tableau 1 Appariement des noms de collectivités de la Société canadienne des postes et des noms des subdivisions de recensement (SDR) du Recensement de 2001

Le taux d'appariement dans le tableau qui précède est d'environ 40 %, en dépit du traitement (uniformisation) assuré pour l'augmenter. L'examen du Fichier Recherche d'adresses de juin 2001 montre les changements qui se sont produits par suite des fusions. Par exemple, Nepean et Ottawa ont été conservés comme noms de collectivités de la SCP, même si Nepean n'existe plus légalement comme municipalité par suite de la fusion. Les noms de rues et les noms de collectivités de la SCP semblent être mis à jour dans le Fichier Recherche d'adresses pour rendre compte des changements qui se sont produits au niveau municipal, une fois que la SCP a résolu la question du caractère unique de l'adresse. Cela peut expliquer l'augmentation légère des taux d'appariement sur quatre ans. Toutefois, aux fins du géocodage, un fichier de correspondance entre les noms de SDR et de collectivités de la SCP est nécessaire, afin que le géocodage puisse être ramené au niveau de la SDR en premier lieu, puis au niveau de l'adresse municipale à l'intérieur de celle­ci7.

Malheureusement, même lorsque les noms de SDR correspondent, il faut plus de renseignements pour définir le secteur à l'intérieur duquel les données sur les adresses municipales peuvent être appariées de façon unique. Il se peut que plus d'une rue aient le même nom à l'intérieur d'une SDR. Le même code postal peut parfois être attribué à plusieurs SDR. Le géocodage possible à l'intérieur de collectivités de la SCP multiples devrait être envisagé.

Le nom de collectivité de la SCP peut être un outil utile pour localiser les municipalités où se trouve l'adresse municipale. Parfois, une correspondance peut être établie entre la SDR et le nom de collectivité de la SCP sur la base de la province/territoire et des similitudes entre les noms. Toutefois, en raison des différentes dates de référence et des objectifs visés par le nom de SDR et le nom de collectivité de la SCP, cette correspondance n'est pas toujours possible et, même lorsqu'elle est établie, ne peut être effectuée avec un niveau de confiance absolu. Des données supplémentaires sont nécessaires pour établir le secteur à l'intérieur duquel l'adresse municipale peut se retrouver.

Types de codes postaux dans le Fichier Recherche d'adresses

Une fois que la municipalité ou le secteur général desservi par le code postal est établi, le secteur de service propre au code postal doit être défini avant le géocodage. Les types d'enregistrements du Fichier Recherche d'adresses sont essentiels pour établir le type de secteur de service du code postal. La Société canadienne des postes désigne cinq types d'enregistrements dans le Fichier Recherche d'adresses8. Ils sont liés à cinq types différents de livraison. Ces enregistrements sont catégorisés et appelés « CPType » dans le FCCP. La typologie est la suivante9 :

  • CPType 1, Adresse municipale
    Ce type d'enregistrement contient les codes postaux des adresses municipales.
  • CPType 2, Rue desservie par un service associé à un itinéraire ou poste restante
    Ce type d'enregistrement contient les codes postaux attribués aux adresses municipales desservies par un service associé à un itinéraire ou à la poste restante à partir d'installations de livraison – souvent en périphérie des régions urbaines.
  • CPType 3, Adresse de case postale
    Ce type d'enregistrement contient le code postal d'une case postale ou d'une tranche de numéros de cases postales à l'intérieur d'une installation de livraison.
  • CPType 4, Service associé à un itinéraire
    Ce type d'enregistrement contient les codes postaux attribués aux adresses se trouvant sur un itinéraire de route rurale, sur un itinéraire motorisé ou sur un itinéraire de service suburbain desservi à partir d'une installation de livraison.
  • CPType 5, Poste restante
    Ce type d'enregistrement contient les codes postaux attribués à la poste restante à une installation de livraison.

Un code postal peut être lié à plus d'un CPType d'enregistrement. Chaque enregistrement du Fichier Recherche d'adresses de juin 2006 comporte un code postal et un type particulier. Comme le montre le graphique ci­dessous, la grande majorité des enregistrements sont de CPType 1 ou 2.

Figure 1  Fichier Recherche d'adresses de juin 2006, selon le type d'enregistrement. Une nouvelle fenêtre s'ouvrira.

Figure 1 Fichier Recherche d'adresses de juin 2006, selon le type d'enregistrement

Les secteurs de service des enregistrements de CPTypes 1 et 2 sont définis en fonction des adresses municipales. Les adresses municipales (de voirie) sont essentiellement celles qui se trouvent sur la façade des logements ou des immeubles. Comme on peut le voir précédemment, les CPTypes d'enregistrements correspondant aux adresses municipales constituaient 98 % des enregistrements du Fichier Recherche d'adresses en juin 2006. La plupart des côtés d'îlots urbains et de nombreuses rues résidentielles dans les régions urbaines ne comportent généralement qu'un code postal correspondant à l'adresse municipale. Même s'il peut être difficile de trouver la collectivité de la SCP et de localiser la ou les régions géographiques normalisées pour un code postal, les secteurs de service de ces codes postaux peuvent être considérés comme complètement définis dans les données sur les adresses fournies par la Société canadienne des postes. Dans ce cas, le géocodage est simple si le nom de rue et les données sur les adresses peuvent être appariés aux données de la même date de référence dans le cadre géographique de Statistique Canada.

Aucune donnée sur les adresses municipales des secteurs de service n'est fournie pour les CPTypes d'enregistrements 3, 4 et 5. Les secteurs de service de ces codes postaux ne sont pas directement définis dans le Fichier Recherche d'adresses. Dans le cas du CPType 3, le Fichier Recherche d'adresses fournit les codes postaux de cases postales ou de tranches de numéros de cases postales à l'intérieur d'une installation de livraison. Tous les codes postaux peuvent être couplés avec l'installation qui les dessert10. On peut au moins coder les codes postaux des enregistrements de CPTypes 3, 4 et 5 en fonction de la SDR où l'installation de livraison est située (si l'adresse de l'installation de livraison peut être géocodée). Dans le cas des enregistrements de CPType 4, il est parfois possible d'obtenir les noms des itinéraires desservis. Il s'agit notamment de la livraison selon des routes bien définies dans des régions rurales établies, ainsi que des livraisons à des parcs industriels et à des groupes de boîtes postales. Pour les enregistrements de CPType 5, les seuls renseignements disponibles sont le nom de collectivité de la SCP du secteur desservi. Dans tous les cas, le secteur de service n'est pas nécessairement celui où l'installation de livraison est située, et le secteur de service n'est pas défini en fonction des tranches d'adresses municipales. En résumé, les codes postaux de CPTypes 3, 4 ou 5 (contrairement aux CPTypes 1 et 2) ne comprennent pas d'empreinte géographique précise permettant une association directe et complète avec les fichiers géographiques de Statistique Canada. D'autres sources de données décrivant les modèles d'utilisation doivent être examinées pour décider de la façon de répartir les secteurs de service pour ces codes postaux et de géocoder ces codes postaux à partir des données disponibles.

Du fait de l'urbanisation accrue et du plus grand nombre d'adresses municipales, la proportion d'enregistrements de CPType 2 a augmenté légèrement. Le tableau ci­après illustre les changements au fil du temps.

Tableau 2 Changements dans les combinaisons de type de codes postaux dans le Fichier Recherche d'adresses. Une nouvelle fenêtre s'ouvrira.

Tableau 2 Changements dans les combinaisons de type de codes postaux dans le Fichier Recherche d'adresses

Même si le pourcentage de chaque CPType de code postal urbain est demeuré constant, le pourcentage de codes postaux comprenant CPType 2 a connu une légère hausse dans les secteurs de livraison rurale. La légère augmentation de la proportion de codes postaux comportant des enregistrements de tranches d'adresses municipales pourrait entraîner une légère hausse de la proportion de codes postaux pouvant être géocodés selon une tranche d'adresses municipales.

Comme on peut le voir, un code postal peut comporter plus d'un CPType d'enregistrement. Cela se produit généralement dans les régions considérées comme « rurales » par la Société canadienne des postes. Les enregistrements de CPType 2 ne viennent jamais seuls, et s'accompagnent toujours d'enregistrements de CPTypes 3, 4 et 5. Au fil du temps, la proportion de codes postaux comportant des enregistrements de CPType 2 continue d'augmenter. Cela pourrait constituer une indication de l'augmentation du nombre d'adresses municipales, particulièrement dans les endroits où le service était associé à un itinéraire (CPType 4). Par exemple, le code postal K7V3Z8 est associé à un code postal se trouvant sur un itinéraire de distribution (CPType 4). Toutefois, il contient également des enregistrements de CPType 2 auxquels des adresses municipales sont liées. Les régions très rurales ont tendance à comporter uniquement enregistrements de CPTypes 5 et/ou 3.

Les enregistrements de CPType 1 se retrouvent dans des régions urbaines et ont tendance à être isolés, sauf dans quelques cas où ils sont liés à des enregistrements de CPType 3. Un exemple de ce genre de situation est le code postal K1A 9Z611. Il est lié à une case postale et à un ensemble d'adresses municipales. L'enregistrement d'adresse municipale (CPType 1) permet de compléter l'information grâce à l'adresse de l'installation de livraison (CPType 3) pour le même code postal12. Effectivement, ces codes postaux comportent deux CPTypes, mais se rapportent à un seul immeuble (ou entreprise) qui reçoit du courrier.

Le secteur de service d'un code postal peut être considéré comme correspondant à un secteur où des personnes ont accès au courrier grâce à ce code postal. Dans le cas des codes postaux de CPTypes 1 et 2, il s'agit de logements et d'immeubles desservis par la poste selon leur adresse municipale. Dans le cas des codes postaux de CPType 4, il s'agit de tous les secteurs qui sont desservis par un itinéraire de distribution du courrier. Dans le cas des codes postaux de CPTypes 3 et 5, il s'agit de logements et d'immeubles dont les occupants ont généralement accès au service de livraison postale par l'entremise d'une installation de livraison. Le secteur de service d'un code postal individuel comprend chacun de ces types d'enregistrements. L'examen des combinaisons de types d'enregistrements liés à chaque code postal peut aider à déterminer si et comment la couverture de ces secteurs de service se chevauche. Cela permet de décider si certains enregistrements sont plus représentatifs de l'empreinte géographique du code postal.

Certains types d'enregistrements peuvent être considérés comme plus représentatifs du secteur de service définitif lié à ce code postal. Par exemple, le CPType 1 est plus représentatif d'un immeuble/logement particulier desservi que le CPType 5. Le CPType 4 est représentatif d'itinéraires particuliers desservis, tandis que le CPType 5 n'est pas davantage lié à un emplacement particulier qu'à un autre à l'intérieur de la collectivité de la SCP (sur la base des données sur les adresses disponibles). Comme il est indiqué précédemment dans la présente section, lorsqu'un enregistrement de type 1 et un enregistrement de CPType 3 correspondent au même code postal, l'enregistrement de CPType 1 comprend l'adresse des utilisateurs du service postal. Cela laisse supposer que les enregistrements les plus représentatifs de la couverture des codes postaux seraient les suivants :

  • CPType 1 plutôt que CPType 3, lorsque les deux sont présents dans le code postal;
  • CPType 2 ou CPType 4, plutôt que CPType 3 ou CPType 5, lorsque les deux sont présents dans le code postal.

Les CPTypes 2 et 4 peuvent couvrir le même secteur. Le secteur desservi par un itinéraire de distribution (CPType 4) peut être assez précis, même s'il ne peut être localisé sur la base des données sur les adresses du Fichier Recherche d'adresses. Ces données ne sont pas suffisantes pour décider lequel de ces enregistrements (CPType 2 ou 4) est le plus représentatif. Toutefois, le CPType 2 peut avoir préséance sur le CPType 4 dans le processus de géocodage, comme étant plus représentatif, étant donné qu'il est probable qu'il sera mieux géocodé (compte tenu des données particulières sur les adresses), et qu'il représente aussi probablement une partie de la couverture des enregistrements de CPType 4, par suite des progrès réalisés au chapitre des adresses municipales. Essentiellement, lorsque plus d'un type d'enregistrement est lié à un code postal, le type d'enregistrement peut être utilisé comme un des critères pour choisir l'indicateur le plus représentatif de l'empreinte spatiale de ce code postal.

Une fois que la collectivité de la SCP a été appariée à une SDR, les enregistrements de CPTypes 1 et 2 peuvent être géocodés sur la base des données sur les adresses municipales, mais le manque de données sur les adresses municipales pour les types 3, 4 et 5 rend leur codage presque impossible à un niveau plus précis que la SDR. Étant donné que le but visé est de mettre en correspondance l'ensemble des empreintes de codes postaux, de plus amples renseignements sont nécessaires dans les cas où les codes postaux comportent des enregistrements de CPTypes 3, 4 et 5. Les types d'enregistrements peuvent aussi être utilisés comme facteurs pour déterminer le couplage le plus représentatif de codes postaux et de régions géographiques normalisées. En conclusion, le type d'enregistrement est essentiel pour déterminer la nature de l'empreinte du secteur de service du code postal.

Enregistrements des codes postaux et couverture de la région géographique

Il se peut qu'un code postal qui correspond spécifiquement à des tranches d'adresses municipales couvre plus d'un côté d'îlot ou îlot. Par conséquent, lorsqu'un code postal du Fichier Recherche d'adresses est lié à plus d'un enregistrement, chacun comportant sa propre tranche d'adresses, cela peut légitimement mener à la couverture de plus d'un côté d'îlot (ou îlot de diffusion). Cela est également possible si une tranche d'adresse unique provenant du Fichier Recherche d'adresses couvre plus d'un côté d'îlot ou un côté d'îlot de diffusion. Le tableau ci­dessous montre le nombre d'enregistrements du Fichier Recherche d'adresses liés à chaque combinaison de type d'enregistrement et de code postal.

Tableau 3 Nombre d'enregistrements selon le type d'enregistrement dans le Fichier Recherche d'adresses - Juin 2001 et juin 2006. Une nouvelle fenêtre s'ouvrira.

Tableau 3 Nombre d'enregistrements selon le type d'enregistrement dans le Fichier Recherche d'adresses – Juin 2001 et juin 2006

L'examen du tableau qui précède montre que même si les enregistrements de type 1 sont liés à une tranche d'adresses environ 70 % du temps, ils couvrent parfois plus de 50 tranches d'adresses (potentiellement 50 côtés d'îlots ou îlots de diffusion). Selon notre expérience du géocodage des enregistrements de CPTypes 1 et 2, lorsqu'un code postal comprend plus d'un enregistrement de tranche d'adresses municipales, la couverture porte sur des côtés d'îlot consécutifs ou adjacents. Les enregistrements de CPType 2 semblent comporter le nombre le plus important de tranches d'adresses définies. Les enregistrements de CPType 4 comportent des itinéraires et ceux­ci peuvent couvrir de grands secteurs, même si les enregistrements de ce type ne sont pas très nombreux dans le Fichier Recherche d'adresses. Les enregistrements de CPType 3 sont généralement liés à une ou plusieurs cases postales d'une installation de livraison, et un enregistrement seulement est lié à l'installation. De même, le CPType 5 a trait à la livraison qui est disponible à partir d'une installation et peut comporter un seul enregistrement. Il convient de mentionner ici que pour les enregistrements de CPType 1, et particulièrement ceux de CPType 2, il se peut qu'aucun enregistrement géocodé (côté d'îlot ou îlot) ne soit plus représentatif qu'un autre du code postal, du point de vue du service fourni.

1.4 Fichiers de localisation des installations de livraison

Les codes postaux de CPTypes 3 et 5 sont liés à la cueillette du courrier dans une installation de livraison (plutôt qu'à sa livraison à une adresse municipale). Les adresses municipales liées à l'installation de livraison sont disponibles dans le Fichier sur les chefs de ménage. Les emplacements de ces installations de livraison ont aussi été obtenus récemment auprès de la SCP par Statistique Canada. Les emplacements ne correspondent pas toujours aux coordonnées du Fichier du réseau routier de Statistique Canada. Cela signifie que lorsque des données sur les adresses sont disponibles et peuvent être appariées aux données figurant dans le Fichier du réseau routier, il est plus approprié de procéder au géocodage à partir de celui­ci, afin que l'emplacement de l'installation par rapport aux données du réseau routier soit le plus précis possible. Lorsque des données sur les adresses ne sont pas disponibles, l'adresse de l'emplacement du bureau de poste peut être confirmée auprès de la Société canadienne des postes. Statistique Canada tiendra à jour une liste des adresses d'installations de livraison et des îlots de diffusion connexes, afin de permettre le géocodage des codes postaux. Dans la section 2.0, on tente de déterminer si certains codes postaux devraient être liés à l'installation de livraison seulement.

1.5 Type d'enregistrement et type de mode de livraison à partir du Fichier sur les modes de livraison

Le type de mode de livraison (TML) comprend des détails sur le service de livraison offert13. Il sert à calculer les taux pour les services postaux (Société canadienne des postes, 2005c, page 2). La description et la typologie de la SCP sont les suivantes :

A = Livraison à une adresse à l'intérieur d'un côté d'îlot
B = Livraison à un immeuble d'appartements
E = Livraison à un immeuble commercial
G = Livraison à un gros destinataire de courrier
H = Livraison par route rurale
J = Poste restante
K = Livraison à une case postale (pas une boîte postale communautaire)
M = Livraison à un gros destinataire de courrier desservi par une case postale
T = Livraison par service suburbain
X = Livraison par itinéraire motorisé
Z = Code postal retiré (aucune autre livraison à ce code)

Le type de mode de livraison peut être utile pour illustrer si le géocodage s'applique à un immeuble particulier, soit peut‑être un « sous‑ » côté d'îlot. Comme le montre le tableau ci­après, dans quelques cas, les enregistrements de codes postaux peuvent être liés à un immeuble particulier.

Tableau 4 Enregistrements de type 1 à partir du Fichier Recherche d'adresses de juin 2006 et TML tiré du Fichier sur les modes de livraison de juin 2006. Une nouvelle fenêtre s'ouvrira.

Tableau 4 Enregistrements de type 1 à partir du Fichier Recherche d'adresses de juin 2006 et TML tiré du Fichier sur les modes de livraison de juin 2006

Comme on peut le voir, les combinaisons les plus fréquentes de TML et de CPType sont liées à des tranches d'adresses bien définies (TML = « A »). Les autres CPType 1 sont liés à des immeubles d'appartements (TML = « B ») et à différents types d'entreprises (TML = « E » et « G »). La majeure partie du géocodage des enregistrements de CPType 1 peut simplement être effectuée à partir des données sur les adresses. Toutefois, il est particulièrement important que les immeubles comportant des populations importantes soient géocodés de façon appropriée. Par exemple, un immeuble peut correspondre à un établissement de santé qui représente un îlot, une aire de diffusion ou une subdivision de recensement (SDR) complets. Dans de rares cas où une SDR complète est représentée dans un établissement, sa population peut être équivalente à l'ensemble de la population de la SDR. Pour les codes postaux de CPType 1, le TML permet de faire une distinction entre le type d'immeuble (logement, appartement, gros destinataire de courrier, etc.) qui est représenté par le code postal. Le TML ne comprend pas plus de renseignements que le type d'enregistrement pour localiser tous les types de codes postaux d'après les données sur les adresses, bien qu'il donne de l'information sur le genre d'immeuble qui reçoit le courrier.

1.6 Considérations relatives au géocodage fondé sur les données de la SCP

Ces considérations relatives au géocodage font suite à l'examen des données de la SCP de la présente section. Ces considérations, de pair avec les conclusions de la section suivante sur la façon dont les codes postaux sont utilisés et déclarés, permettront d'élaborer les règles du géocodage.

Les considérations relatives à l'élaboration des règles de géocodage sont les suivantes :

  • Le nom de collectivité de la SCP et la première lettre du code postal constituent parfois, mais pas toujours, une façon de localiser la SDR pour le géocodage. Même si, en théorie, plus de 97 % des enregistrements du Fichier Recherche d'adresses comprennent des données sur les adresses municipales, moins de 40 % des noms uniques de collectivités de la SCP peuvent être appariés à la structure de la SDR. Cela fait ressortir dès le départ la nécessité de données supplémentaires pour confirmer et compléter le géocodage.
  • Dans le cas des CPTypes 1 et 2, le nom de collectivité de la SCP combiné aux données sur les adresses municipales permettent de déterminer uniquement les adresses municipales (représentant les logements et les immeubles) desservies par le code postal, à condition que le secteur qui est représenté par le nom de collectivité de la SCP puisse être trouvé.
  • Dans le cas des CPTypes 3, 4 et 5, le secteur de service n'est pas défini au moyen des adresses municipales. Des données supplémentaires sur la façon dont ces codes postaux sont utilisés sont nécessaires pour les géocoder.
  • Les combinaisons de types d'enregistrements pour un code postal peuvent servir à déterminer les enregistrements les plus représentatifs ou indicatifs pour ce code postal. Toutefois, il peut y avoir plus d'un enregistrement de tranche d'adresses lié à un type d'enregistrement pour un code postal, et ces codes postaux peuvent de façon assez légitime être liés à plus d'un côté d'îlot ou îlot.

En conclusion, des données supplémentaires sur les secteurs desservis par le code postal sont nécessaires pour élargir et valider le géocodage partiel qui peut être effectué à partir des fichiers de la SCP seulement.

2.0 Utilisateurs des codes postaux et géographie

Après examen des données sur les codes postaux dans la section précédente, le défi principal subsiste : comment élaborer un secteur de recherche à partir duquel le code postal peut être géocodé. Les noms de collectivités de la SCP représentent des noms de lieux qui ne correspondent habituellement pas aux noms ou aux limites des SDR du cadre géographique de Statistique Canada. Dans la section qui précède, la discussion sur l'utilisation des fichiers de la SCP pour le géocodage a montré que des données supplémentaires sont nécessaires. Les questions de fond qui restent sans réponse sont les suivantes :

  1. Étant donné que moins de 40 % des noms uniques de collectivités de la SCP correspondent à une SDR, comment pouvons­nous géocoder les adresses comprenant les 60 % qui restent de noms de collectivités de la SCP?
  2. Comment le secteur de service peut­il être déterminé pour les enregistrements de types 3, 4 et 5, pour lesquels nous n'avons pas d'adresses municipales?
  3. Existe­t­il des données supplémentaires qui peuvent servir à valider le géocodage fondé sur les données sur les adresses?

Les renseignements supplémentaires dont il est question ici sont des renseignements fondés sur l'utilisation déclarée du code postal. Le secteur où le code postal est utilisé est appelé secteur de service du code postal. Les secteurs de service, sur la base des codes postaux déclarés dans le Recensement de la population, fournissent les renseignements supplémentaires nécessaires pour assurer et confirmer le géocodage. Cela s'ajoute à la recherche de la SDR, sur la base du nom de collectivité de la SCP. Des améliorations à ce processus sont examinées à l'annexe C. La présente section met l'accent sur la façon dont les personnes ou les ménages utilisent les codes postaux, et comment ceux‑ci viennent compléter et confirmer les données sur les adresses de la SCP.

Les utilisateurs des codes postaux sont des personnes et des entreprises. Toutefois, le rapport entre ces unités statistiques et les codes postaux est indirect. Comme il est indiqué dans la section précédente, les codes postaux ne sont pas attribués à des personnes ou des entreprises, mais bien à des immeubles et des logements14. L'exception à cette règle est le fait que moins de 2 % des enregistrements d'adresses de codes postaux ont un type de mode de livraison « G » ou « M », lesquels sont associés à un gros destinataire de courrier. Une source de données est aussi nécessaire pour déterminer le secteur de service de cette façon. Dans le cas des personnes, les rapports suivants doivent exister entre les sources de données :

Figure 2  Code postal utilisé en rapport avec la région géographique de résidence. Une nouvelle fenêtre s'ouvrira.

Figure 2 Code postal utilisé en rapport avec la région géographique de résidence

Essentiellement, le rapport de la personne avec le code postal et la région géographique normalisée peut servir à faire le lien entre ces derniers.

Même si une telle source de données est disponible pour le code postal, la question subsiste quant à la région géographique normalisée liée à ce code postal. Par exemple, il y aurait un risque que la région géographique normalisée attribuée dans la source des données ne corresponde pas à celle du domicile de la personne, mais soit liée à la région géographique normalisée de travail. Ces risques doivent être équilibrés du point de vue de la façon dont les personnes et les entreprises utilisent les codes postaux.

2.1 Personnes et codes postaux déclarés dans le recensement

Le Recensement de la population est la seule source comprenant un code postal déclaré et la région géographique normalisée pour toutes les personnes au Canada. Les ménages au Canada doivent déclarer (ou confirmer) leur code postal dans le formulaire de recensement. Ce code postal de répondant correspond généralement au code postal de la résidence du ménage. Il peut être utilisé pour estimer le secteur de service d'un code postal.

Un ménage est généralement défini comme étant constitué d'une personne ou d'un groupe de personnes qui résident ensemble dans un logement ou qui occupent un logement.

Le recensement est l'enquête permettant de recueillir les données les plus complètes sur les codes postaux des ménages pour le Canada. Le code postal fourni par le répondant dans le cadre du recensement et le code postal attribué au logement de la personne par la SCP sont généralement les mêmes. Ces données peuvent servir à déterminer la région géographique normalisée liée au code postal déclaré dans le cadre du recensement. Le diagramme ci­après montre comment ces éléments sont liés.

Figure 3 Utilisation des codes postaux par les ménages. Une nouvelle fenêtre s'ouvrira.

Figure 3 Utilisation des codes postaux par les ménages

Dans le cadre du recensement, on demande aux répondants de fournir le code postal de leur résidence. Étant donné que ces renseignements sont disponibles au niveau du ménage et au niveau de l'îlot de diffusion, pourquoi ne pas simplement attribuer des codes postaux aux îlots de diffusion (et autres régions géographiques normalisées), sur la base du recensement seulement? Les régions géographiques normalisées servent généralement de base à l'analyse, et toute extraction de données à partir du code postal peut être effectuée à partir de ces régions géographiques normalisées. Toutefois, si les régions géographiques normalisées doivent être utilisées comme moyen pour coupler de façon fiable les codes postaux et d'autres données, les données du recensement doivent être complétées par le géocodage pour les raisons suivantes :

  1. Les codes postaux changent chaque mois, et des centaines de codes sont créés, modifiés et supprimés. Les données du recensement sont disponibles uniquement tous les cinq ans, et de nombreux mois après le jour du recensement. L'opération de géocodage permet le géocodage opportun de la plupart des codes postaux courants.
  2. À l'occasion, plus d'un code postal peut être utilisé par une personne ou une entreprise. Il se peut qu'une personne reçoive du courrier à son lieu habituel de résidence, qu'une personne occupée qui voyage utilise son adresse au travail et y fasse acheminer son courrier, qu'un étudiant reçoive du courrier à l'adresse de ses parents, ou encore que certaines personnes préfèrent recevoir leur courrier au bureau de poste. Ce sont tous là des exemples d'adresses différentes et de codes postaux différents qui peuvent être utilisés par la même personne. De même, une entreprise peut utiliser un code postal lié à l'immeuble ou au côté d'îlot où est situé cet immeuble, à une case postale, ou au code postal de l'adresse postale de son siège social.
  3. La variable de réponse au code postal doit être vérifiée parce qu'il peut y avoir des variations dans la réponse au code postal (comme il est indiqué précédemment). Le codage des codes postaux en fonction d'un Fichier du réseau routier du cadre géographique de Statistique Canada permet de confirmer que la région géographique normalisée est celle de l'empreinte du code postal.

Les codes postaux déclarés dans le cadre du recensement peuvent servir à mettre en correspondance les secteurs de service, tant pour le code postal que pour la RTA. Ainsi, on peut obtenir des données de meilleure qualité en combinant les données du recensement et celles disponibles auprès de la SCP.

2.2 Identification du secteur de recherche pour le géocodage

Étant donné que moins de 40 % des noms uniques de collectivités de la SCP correspondent à une SDR, comment pouvons­nous géocoder les adresses comprenant les 60 % qui restent de noms de collectivités de la SCP? On peut localiser les noms de rue et les adresses pour le géocodage à partir des données du recensement.

Un essai a été mené à l'automne 2005, afin de mesurer le taux de géocodage fondé sur les secteurs de service de RTA. Étant donné que les RTA sont plus stables que les codes postaux au fil du temps, des secteurs de recherche ont été créés à partir des RTA des codes postaux valides déclarés dans le Recensement de 2001. Pour l'essai de géocodage des codes postaux de juin 2005, des secteurs de service de RTA ont été créés à partir des codes postaux valides en mai 2001. Des îlots de diffusion ont été attribués à une RTA uniquement si un code postal valide comportant cette RTA était déclaré au moins quatre fois dans cet îlot de diffusion15. Le géocodage des codes postaux a été effectué à l'intérieur du secteur de service de la RTA pour la RTA de ce code postal. Essentiellement, les secteurs de service de RTA ont servi de secteurs de recherche pour le géocodage. En dépit de ces critères conservateurs, plus de 88 % des enregistrements comportant une adresse municipale (de CPTypes 1 et 2) ont pu être géocodés, la plupart, au niveau le plus détaillé du côté d'îlot.

L'utilisation de ces secteurs de recherche semble être une façon productive d'effectuer le géocodage, lorsque le secteur de service du code postal est désigné au moyen d'adresses municipales (CPTypes 1 et 2) et que les adresses municipales et les données du réseau routier connexes sont disponibles dans le Fichier du réseau routier.

Une méthode est nécessaire pour le géocodage des codes postaux qui ne sont pas liés à des adresses municipales (CPTypes 3, 4 ou 5) ou dont les adresses municipales ne se trouvent pas dans le Fichier du réseau routier. Est­ce que le recensement fournit des renseignements suffisants pour les géocoder?

Les données sur le code postal déclarées dans le cadre du Recensement de 2001 peuvent être examinées, afin de déterminer les types de codes postaux qui ont été utilisés. Ces réponses devraient être évaluées avec précaution, certains codes postaux comportant plusieurs types d'enregistrements, et les répondants n'indiquant pas le type d'enregistrement de leur code postal. Les codes postaux sont par conséquent examinés ci­après dans le contexte des combinaisons de types d'enregistrements. Le Fichier Recherche d'adresses de juin 2001 comportait 758 658 codes postaux qui n'ont pas été retirés. Parmi les 673 242 codes postaux valides déclarés dans le cadre du recensement, 673 179 ont été trouvés dans le Fichier Recherche d'adresses de juin 2001.

Un examen détaillé des codes postaux qui n'ont pas été déclarés a révélé ce qui suit.

Tableau 5 Codes postaux qui n'ont pas été déclarés au Recensement de 2001. Une nouvelle fenêtre s'ouvrira.

Tableau 5 Codes postaux qui n'ont pas été déclarés au Recensement de 2001

Il semble que presque tous les codes postaux de livraison rurale sont déclarés. Seulement 19 codes postaux de livraison rurale n'ont pas été déclarés du tout. Cela représente moins de 1 % de tous les codes postaux ruraux. Étant donné que le codage des enregistrements de CPTypes 4 et 5 est particulièrement difficile, l'utilisation des réponses du recensement semble être une approche efficace pour géocoder ces codes dans les régions rurales. Une comparaison des résultats déclarés du Recensement de 2001 et de ceux du Recensement de 2006 devrait nous permettre de déterminer si ces codes postaux sont stables au fil du temps et si, par conséquent, les données du recensement sont suffisantes pour géocoder les codes postaux actifs au moment du recensement.

Un moins grand nombre de codes postaux de livraison urbaine ont été déclarés (en comparaison avec la livraison rurale). Les codes postaux des entreprises ne sont pas déclarés dans le recensement pour des raisons évidentes. Cela semble être le cas pour environ 50 % des codes postaux de CPType 3. Les codes postaux de CPType 5 ne sont peut­être pas utilisés autant dans les secteurs de livraison urbaine, étant donné particulièrement que la plupart des personnes se font livrer le courrier directement à leur résidence. Même si seulement 10 % des codes postaux de type 1 n'ont pas été déclarés, leur nombre est quand même important (76 581). Ces codes postaux ne sont pas considérés comme des codes postaux d'entreprises selon le type d'enregistrement. Toutefois, après un examen plus approfondi, il semble s'agir de codes postaux liés à des immeubles non résidentiels. Par exemple, K2E 7L6, K2E 7J5 et K2E 1B6 sont associés à des adresses municipales le long de la promenade Colonnade à Ottawa. Celle­ci est zonée comme une « zone industrielle générale »16. Les sous­ensembles des codes postaux de CPType 1 qui n'ont pas été déclarés ont été classés par la suite du point de vue de leur TML, puis vérifiés, afin de déterminer s'ils correspondaient à une livraison à une adresse unique.

La ventilation des codes postaux de CPType 1 qui n'ont pas été déclarés figure ci­après.

Figure 4 Codes postaux de CPType 1 non déclarés. Une nouvelle fenêtre s'ouvrira.

Figure 4 Codes postaux de CPType 1 non déclarés

Ensemble, un peu plus de la moitié de ces codes postaux correspondent à une livraison à une adresse unique17. Étant donné que plus de la moitié de ces codes postaux sont liés à une adresse unique, et certains d'entre eux sont clairement désignés comme des adresses commerciales par la SCP, cela laisse supposer que les codes postaux urbains de CPType 1 pourraient en fait être principalement des codes postaux d'entreprises ou d'établissements.

L'utilisation du code postal déclaré dans le recensement constitue probablement un outil approprié pour déterminer les secteurs de service de RTA, tout comme celle des codes postaux liés à des ménages (plutôt qu'à des entreprises ou des établissements). Généralement, les codes postaux de ménages sont déclarés dans le recensement et les secteurs de service créés à partir de la RTA déclarée devraient être suffisants pour le géocodage de la majorité des codes postaux18.

2.4 Recommandations pour le géocodage fondé sur les réponses du recensement

Les données du recensement constituent une bonne source de géocodage, dans les cas où les codes postaux sont utilisés au moment du recensement. Elles peuvent aussi servir à créer les secteurs de recherchepour le géocodage des codes postaux d'adresses municipales. Ces données de base peuvent aider à attribuer les codes postaux aux îlots de diffusion, aires de diffusion et SDR.

L'utilisation du code postal peut changer au fil du temps parce que la Société canadienne des postes modifie les codes postaux et que les utilisateurs peuvent modifier leurs codes postaux déclarés. Par ailleurs, il n'est pas possible d'obtenir un code postal pour chaque ménage dans le cadre du recensement, parce que les réponses sont parfois illisibles, invalides ou laissées en blanc. Toutefois, le code postal figurant dans le recensement, particulièrement s'il est fréquemment déclaré à l'intérieur d'un îlot de diffusion, peut être utilisé efficacement pour définir la RTA du code postal utilisé selon l'îlot. Même si les codes postaux ont tendance à changer un peu chaque mois, le secteur de service de la RTA sera probablement plus stable sur la période de cinq ans séparant les recensements19. La possibilité de géocoder les données de la Société canadienne des postes pour 2005 à partir des secteurs de service créés sur la base des données du Recensement de 2001 laisse supposer que les RTA sont en fait habituellement stables. La stabilité des secteurs de service de RTA, ainsi que du rapport entre les codes postaux déclarés et les régions géographiques normalisées, devraient aussi faire l'objet d'une vérification plus rigoureuse, grâce à la comparaison des résultats du Recensement de 2001 et de ceux du Recensement de 2006.

Les codes postaux déclarés dans le Recensement de 2006 peuvent être utilisés de la façon suivante pour le géocodage.

  • Pour les CPTypes 1 et 2 qui desservent des ensembles particuliers de logements ou d'immeubles, le but visé est le géocodage en fonction de la tranche d'adresses du côté d'îlot. Le secteur de service de la RTA peut être établi avec un niveau de confiance raisonnable. Les enregistrements du Fichier Recherche d'adresses peuvent être géocodés à l'intérieur de ces secteurs de RTA. Les secteurs de recherche de RTA peuvent être complétés par des secteurs de recherche créés à partir du rapport entre le nom de la SDR du recensement courant et les noms de la SDR du recensement précédent. On peut tenter le géocodage selon la région géographique normalisée la plus détaillée en cherchant le nom de rue et la tranche d'adresses dans le secteur de service.
  • Les enregistrements de CPType 4 ne comprennent pas de tranches d'adresses municipales. Toutefois, la déclaration de ces codes postaux permettrait de déterminer où ils sont utilisés, et les mêmes codes postaux déclarés pour ce secteur dans le cadre de plus d'un recensement confirmeraient la stabilité de l'utilisation — d'itinéraires bien définis.
  • Le service est assuré à partir de l'installation de livraison pour les CPTypes 3 et 5. Au premier abord, il semble que ceux­ci devraient être géocodés uniquement en fonction de l'installation de livraison postale. Toutefois, les données du recensement montrent que dans les secteurs de livraison rurale, ces codes postaux sont couramment utilisés et sont peut­être les seuls disponibles. Dans les secteurs de livraison rurale, un code de CPType 5 peut être attribué sur la base des données du recensement. Dans de rares cas, lorsqu'il n'y a pas de codes postaux déclarés pour une région rurale habitée, il est probable que lorsqu'un code postal est utilisé, il s'agit du code postal de l'installation de livraison la plus proche.

Le géocodage directement en fonction des régions géographiques normalisées à partir des données du recensement, plutôt que par suite de la conversion des données géocodées précédemment, devrait être conforme au concept de secteurs de service de code postal et devrait permettre une couverture plus complète et une précision plus grande.

3.0 Règles de géocodage et mesures de la qualité

On peut procéder au géocodage sur la base de règles, en combinant les données du recensement et les fichiers de la SCP. Des indicateurs de qualité peuvent être élaborés pour chaque enregistrement géocodé au moyen de cette méthode, la méthode de géocodage fondée sur des règles et les données utilisées pour le géocodage pouvant servir à créer les indicateurs de qualité.

3.1 Secteurs de service et secteurs de recherche

Les secteurs de service doivent être précisés pour que le processus de géocodage puisse être entrepris. Les secteurs de service et les rapports proposés pour le géocodage sont les suivants :

  1. Secteur de service de la RTA (fondé sur le recensement);
  2. Secteur de service du code postal (fondé sur le recensement);
  3. Fichier de correspondance de la collectivité de la SCP et de la SDR.

Comme il est indiqué précédemment, le secteur de service de la RTA peut servir à la recherche et au géocodage en fonction des tranches d'adresses municipales. Dans le cas du Recensement de 2006, chaque secteur de service de la RTA engloberait toutes les AD qui comprennent au moins un îlot de diffusion où un nombre minimum de répondants ont déclaré cette RTA dans le cadre du recensement20. Le fait de compter un nombre minimum de répondants permet de s'assurer que la RTA est véritablement utilisée et déclarée de façon précise à l'intérieur de l'AD. Étant donné que plus d'une RTA peut être utilisée à l'intérieur d'une AD, les limites de RTA élaborées pour des AD globales se chevaucheront. Toutefois, un léger chevauchement et un surdénombrement ne devraient pas poser de problème, étant donné que ces secteurs de service de RTA ne seront pas utilisés directement pour procéder au géocodage. Les secteurs de service de RTA fourniront uniquement les secteurs de recherche pour la recherche et le géocodage des codes postaux, sur la base des données sur les adresses municipales figurant dans les fichiers du réseau routier.

Le secteur de service du code postal, contrairement au secteur de service de la RTA, sera élaboré de façon plus rigide, afin d'inclure uniquement les îlots de diffusion où ce code postal a été déclaré par un nombre minimum de répondants. Par ailleurs, afin de limiter les chevauchements, seuls les codes postaux les plus souvent déclarés dans cet îlot de diffusion seront retenus. Des critères plus rigides de délimitation sont utilisés parce que le secteur de service du code postal peut servir à géocoder directement le code postal en fonction d'un îlot de diffusion où ce code postal est utilisé.

Toutefois, on ne peut pas attribuer un secteur de recherche à tous les codes postaux sur la base des données fournies dans le Recensement de 200621. Des codes postaux imputés pourraient être utilisés pour créer des secteurs de recherche plus exhaustifs, mais cette façon de faire est généralement un peu moins fiable. Il existe une autre possibilité, à savoir créer le lien entre la SDR utilisée pour le recensement et les anciens noms de la SDR, ainsi que le fichier de noms de lieux de la Division de la géographie.

La couverture de la collectivité de la SCP montre le secteur où le nom de rue est unique. (Comme il est indiqué précédemment, la SCP conserve les anciens noms de municipalités dans les cas de fusions et de modification des limites, tant que les problèmes liés aux adresses municipales en double ne sont pas résolus.) Il est difficile de définir de façon définitive les limites des collectivités de la SCP, parce que ces limites ne sont pas disponibles auprès de la SCP. Toutefois, les SDR peuvent être appariées à une collectivité de la SCP22. Cet appariement entre le nom de la SDR et la collectivité de la SCP peut servir à confirmer le géocodage automatisé selon le secteur de service de la RTA. Toutefois, étant donné que la correspondance est floue du point de vue du secteur couvert, elle ne servira pas de méthode principale pour créer les secteurs de recherche pour le géocodage automatisé. La correspondance de la collectivité de la SCP et de la SDR servira uniquement comme outil de vérification additionnelle du géocodage automatisé et comme méthode secondaire de géocodage.

3.2 Géocodage des codes postaux selon le CPType

Étant donné que le but visé est de géocoder les codes postaux de la façon la plus définitive possible, la priorité sera accordée au géocodage des enregistrements de codes postaux dont les secteurs de service sont définis selon des tranches d'adresses municipales. Il s'agit des codes de CPTypes 1 et 2. La couverture la plus définitive suivante est probablement celle du CPType 4, étant donné que les itinéraires desservis sont définis, même s'ils ne comportent pas d'adresses municipales ou de noms de rue qui peuvent être appariés à un Fichier du réseau routier. Enfin, les CPTypes 3 et 5, qui sont liés à une installation de livraison postale, mais qui peuvent être utilisés par les ménages de divers secteurs de la collectivité de la SCP ou même par des voyageurs ou d'autres personnes à l'extérieur de la municipalité, auront la priorité en ce qui a trait à l'affectation des régions géographiques normalisées au code postal. Cette affectation des régions géographiques normalisées dans le contexte du type de service disponible à l'endroit en question met l'accent sur le code postal le plus susceptible d'être utilisé dans cette région géographique normalisée.

Les codes postaux de CPTypes 1 et 2 peuvent définitivement être géocodés grâce à l'appariement des données sur les adresses de la SCP et de celles du Fichier du réseau routier. Si l'appariement repose uniquement sur les données du réseau routier et celles sur les adresses, on pourra obtenir des appariements multiples (dans l'ensemble du Canada). Par exemple, il existe de nombreuses rues « Principale » au Canada. La recherche du nom de rue « Principale » donnera lieu à des appariements multiples. Dans le programme d'appariement automatisé, les appariements seront effectués à l'intérieur d'un secteur de recherche. Les essais effectués jusqu'à maintenant laissent supposer que le secteur de recherche de la RTA peut être utilisé
comme secteur de recherche principal. La SDR de l'appariement peut aussi être confirmée par le fichier de correspondance de la collectivité de la SCP et de la SDR (voir l'annexe C sur la création d'une correspondance entre la collectivité de la SCP et la SDR). Dans la mesure du possible, les enregistrements de CPTypes 1 et 2 devraient être géocodés selon le côté d'îlot ou l'îlot de diffusion, étant donné qu'ils correspondent de toute évidence à la livraison postale à des tranches d'adresses. La précision du géocodage peut aussi être contrôlée – le nombre d'îlots de diffusion ou de côtés d'îlot géocodés devrait être proportionnel aux enregistrements de tranches d'adresses du Fichier Recherche d'adresses de la SCP. De cette façon, les données du recensement et les données du Fichier Recherche d'adresses de la SCP peuvent être combinées pour procéder au géocodage et en évaluer la qualité.

Diverses combinaisons de CPTypes 2, 3, 4 et 5 sont obtenues en parallèle, particulièrement dans les secteurs de livraison rurale (voir le tableau 5). Les codes postaux déclarés dans le recensement ne comprennent pas de renseignements sur le type d'enregistrement. Par conséquent, le CPType de service lié au code postal ne peut être déduit. Le Fichier Recherche d'adresses de la SCP comprend des données sur l'adresse municipale pour les codes de CPType 2, mais la couverture de chacun des autres CPTypes, pour un code postal donné, ne peut être déduite. Compte tenu de cela, le géocodage d'une partie d'un type particulier de code postal de CPType 3, 4 ou 5 peut ne pas être précis du point de vue de l'utilisation. Par le passé, les codes postaux liés à des installations de CPType 3 principalement devaient être codés (dans le FCCP) selon l'îlot de l'installation. L'approche dans ce cas consiste à poursuivre ce codage, tout en désignant l'enregistrement du FCCP comme se rapportant à l'installation. Toutefois, lorsque la poste restante (CPType 5) et la case postale (CPType 3) sont les seuls services disponibles, ils peuvent aussi être géocodés selon la région géographique normalisée, du fait qu'il s'agit du code postal le plus couramment utilisé dans ce cas. L'approche qui suit est proposée pour les codes postaux comportant toute permutation d'enregistrements de CPTypes 2, 3, 4 et 5.

  1. Si le code postal comporte des enregistrements de CPType 2, à l'intérieur du secteur de recherche de la RTA, coder tous les enregistrements de CPType 2 selon les données sur les adresses du Fichier Recherche d'adresses.
  2. Si les îlots de diffusion du secteur de service du code postal n'ont pas été complètement géocodés à l'étape précédente, attribuer les îlots de diffusion restants qui sont géocodés de façon incomplète (ou qui ne sont pas géocodés) et les AD de ce secteur de service de code postal le plus possible en fonction des enregistrements de CPType 4. Lorsque les codes postaux sont liés à des enregistrements de CPType 4 seulement ou à des enregistrements de CPTypes 4 et 2 seulement, tous les enregistrements restants à ce moment­là peuvent être attribués au CPType 4. Toutefois, lorsqu'un enregistrement de CPType 4 s'accompagne d'enregistrements de CPType 3 et/ou 5 (moins de 0,5 % des codes postaux), il se peut qu'un traitement manuel au moyen de cartes soit nécessaire pour assurer la couverture appropriée des itinéraires liés aux enregistrements de CPType 4.
  3. Toutes les régions géographiques normalisées restantes du secteur de service du code postal qui n'ont pas été attribuées pourraient l'être aux enregistrement de CPType 5 au niveau de l'AD, selon le principe que ce service est accessible à partir de l'installation de livraison postale pour les ménages de ce secteur. De même, lorsqu'un service de poste restante (CPType 5) n'est pas disponible, les îlots de diffusion pourraient être codés selon l'enregistrement de CPType 3 de ce secteur du service de code postal.

Dans les AD peu peuplées, où le service postal utilisé n'est pas évident à partir des réponses fournies ou des données sur les adresses, ce service est probablement assuré à partir de l'installation postale la plus proche. Ces AD pourraient être codées selon le code postal de l'installation de livraison la plus proche où le service postal est accessible (type 5 ou 3). Le géocodage effectué de cette façon pourrait être signalé à l'aide d'un champ indiquant la source de géocodage. Le but visé est d'assurer le géocodage complet des codes postaux dans le contexte du service disponible dans chaque AD habitée.

La méthode de géocodage décrite ici repose sur le secteur de service de la RTA, le recensement servant de secteur de recherche principal. Les enregistrements de CPTypes 1 et 2 sont par la suite géocodés à l'intérieur de ce secteur, grâce à un appariement en fonction des données sur les adresses municipales. Lorsque cela n'est pas possible, le rapport entre la collectivité de la SCP et la RTA à la SDR pourra être utilisé. Le géocodage des enregistrements de CPTypes 3, 4 et 5 est plus complexe, étant donné que ceux­ci ne correspondent pas à des adresses municipales. Toutefois, les réponses du recensement peuvent être utilisées pour effectuer le codage dans les secteurs où ces codes postaux sont utilisés. Les enregistrements de CPTypes 3 et 5 continueront aussi d'être codés selon l'installation postale, ainsi que le secteur de service. Ainsi, tous les codes postaux utilisés peuvent être mis en correspondance avec des régions géographiques, sur la base des données du recensement disponibles et du Fichier du réseau routier.

3.3 Mesures de la qualité

La qualité du géocodage des codes postaux peut être améliorée et faire l'objet de meilleurs rapports, compte tenu du concept de géocodage selon la RTA et les secteurs de service de code postal. (Le contexte et les définitions des mesures de la qualité figurent à l'annexe B.)

A. Actualité

L'actualité peut être mesurée du point de vue de la différence entre les éléments suivants :

  1. La date de référence des codes postaux et la date de diffusion des produits postaux;
  2. La date de référence du recensement et la diffusion des produits fondés sur les codes postaux.

L'examen conceptuel dont il est question précédemment prévoit le géocodage fondé sur des règles pour les codes postaux, selon les côtés d'îlot de diffusion, les îlots de diffusion et les AD du cadre géographique de Statistique Canada. Le géocodage automatisé a été mis à l'essai et peut améliorer l'efficacité du processus. Même s'il n'est pas possible d'utiliser le géocodage automatisé lorsque les données sont insuffisantes dans le cadre géographique ou qu'il existe des incohérences entre le cadre géographique et les données de la SCP, il peut servir pour la majorité des enregistrements. Cette efficacité peut entraîner les améliorations suivantes:

  • Moins de ressources de géocodage manuel seront nécessaires pour que le FCCP et le FCPCEF puissent être disponibles;
  • Le délai entre la disponibilité des résultats du Recensement de 2006 et la diffusion des produits fondés sur les codes postaux (FCCP et FCPCEF) peut être réduit.

Il existe des différences de dates de référence entre les données du recensement (disponibles une fois tous les cinq ans), les fichiers de la Société canadienne des postes (disponibles une fois par mois) et les fichiers du réseau routier, qui sont périodiquement mis à jour. Cela peut entraîner des difficultés dans la création de l'association ou du lien dans le cadre du processus de géocodage. Lorsqu'il manque des données à jour dans les fichiers du réseau routier, on résout habituellement la question en communiquant avec la municipalité appropriée et en obtenant l'information. Il peut s'agir d'un processus long, qui peut imposer un fardeau à la municipalité. Une façon de résoudre ce problème consisterait à échelonner le géocodage, c'est­à­dire que l'on coderait en fonction de la SDR ou de l'AD uniquement en l'absence de données dans le Fichier du réseau routier, et que l'on coderait selon des niveaux plus précis, au fur et à mesure que les renseignements deviennent disponibles. À l'heure actuelle, une fois qu'un code postal est géocodé, nous ne le récupérons jamais pour tenter d'en améliorer la précision. En fait, il se peut qu'un code postal ne soit jamais géocodé à nouveau, à moins que la Société canadienne des postes n'indique un changement de service pour ce code postal. Grâce au géocodage automatisé, nous pourrions envisager des améliorations de la précision avec chaque version du Fichier du réseau routier.

B. Exactitude et précision

L'exactitude du processus de géocodage se mesure par le degré de conformité du géocodage selon la ou les régions géographiques normalisées appropriées. La précision peut être mesurée en fonction de la correspondance entre le nombre de côtés d'îlot et d'îlots de diffusion codés et les tranches d'adresses desservies par le code postal.

Une cote de qualité au niveau de l'enregistrement peut être créée, sur la base du processus de géocodage, afin d'indiquer le niveau de confiance de ce dernier. L'accès à plus d'une source d'information pour le géocodage permet en outre l'élaboration d'indicateurs de qualité. Il existe une façon d'attribuer l'indicateur de qualité, à savoir élaborer un indicateur à trois caractères fondé sur le processus de géocodage proprement dit. Les caractères devraient être facilement compréhensibles, « AAA » laissant supposer que la qualité du géocodage a été confirmée par plus d'une source et a été jugée la meilleure, et « CCC » indiquant que le géocodage constitue une approximation. Le tableau suivant illustre le concept proposé.

Indicateurs de qualité pour les enregistrements de CPTypes 1 et 2

L'indicateur de qualité (IQ) final est élaboré sous forme de concaténation, par exemple :

IQ = IQ_1 ¦ IQ_2 ¦ IQ_3

Un IQ = AAA correspond au meilleur géocodage possible.

Indicateur de qualité (IQ_1)
Cet indicateur concerne la qualité du secteur général en fonction duquel le géocodage a été effectué. Il devrait constituer une indication de la certitude du géocodage selon la subdivision de recensement appropriée (et les parties appropriées de cette SDR).
A : Secteur de recherche fondé sur le secteur de service de la RTA, et la correspondance entre la collectivité de la SCP et la SDR
B : Secteur de recherche fondé sur le secteur de service de la RTA seulement
C : Secteur de recherche fondé sur la correspondance entre la collectivité de la SCP et la SDR seulement

Indicateur de qualité (IQ_2)
Il s'agit d'un indicateur de l'appariement des rues pour les enregistrements de CPTypes 1 et 2.
A : Appariement trouvé selon le nom de rue, le type et la direction uniformisés dans le Fichier du réseau routier
Appariement trouvé selon le nom de rue et le type, pour seulement une rue, celle­ci ne comportant pas de direction dans le Fichier Recherche d'adresses ou le Fichier du réseau routier
B : Appariement d'une seule combinaison de rue et de type à l'intérieur du secteur de recherche
C : Appariement satisfaisant par rapport au nom de rue seulement, ou au nom de rue et à la direction

Indicateur de qualité (IQ_3)
L'IQ a été attribué de la façon suivante dans les appariements de tranches d'adresses et du Fichier du réseau routier.
A : Parité appariée pour les deux adresses du Fichier du réseau routier
B : Parité appariée pour une adresse seulement du Fichier du réseau routier
C : Parité non appariée, mais chevauchement des tranches dans le Fichier du réseau routier

Cet indicateur de qualité s'applique au processus d'appariement des adresses municipales pour les CPTypes 1 et 2 (environ 97 % des enregistrements du Fichier Recherche d'adresses). Un indicateur de la qualité des données pourrait aussi être fourni de façon similaire pour les codes postaux codés directement selon une installation.

Lorsque le géocodage est effectué sur la base des données du recensement seulement, une mesure de stabilité pourrait être créée, à partir de la comparaison de la région géographique déclarée dans le recensement précédent. Cette validation ne constitue pas une mesure directe de l'exactitude, mais fournit une indication du degré de confiance du géocodage.

Indicateurs de qualité pour les enregistrements de CPTypes 3, 4 et 5

L'indicateur de qualité (IQ) final est élaboré sous forme de concaténation, par exemple :

IQ = IQ_1 ¦ IQ_2

Un IQ = AA correspond au meilleur géocodage possible. Il n'y a pas de IQ_3 disponible pour les CPType 3, 4 et 5, étant donné qu'il n'existe pas de données sur les tranches d'adresses municipales décrivant le secteur de service, et que le géocodage n'est pas effectué selon la même précision.

Indicateur de qualité (IQ_1)
Cet indicateur concerne la qualité du secteur général en fonction duquel le géocodage a été effectué. Il devrait constituer une indication de la certitude du géocodage selon la subdivision de recensement appropriée (et les parties appropriées de cette SDR). IQ_1 est élaboré exactement de la même façon que pour les CPTypes 1 et 2.

A : Secteur de recherche fondé sur le secteur de service de la RTA et la correspondance entre la collectivité de la SCP et la SDR
B : Secteur de recherche fondé sur le secteur de service de la RTA seulement
C : Secteur de recherche fondé sur la correspondance entre la collectivité de la SCP et la SDR seulement

Indicateur de qualité (IQ_2)
Il s'agit d'un indicateur de la stabilité de la définition des limites de ces secteurs de service. IQ_2 est élaboré différemment que pour les CPTypes 1 et 2, aucune donnée d'adresse municipale n'étant disponible pour le géocodage.

CPTypes 3, 4, 5 (emplacement du secteur de service du code postal)

A : Secteur stable (c.­à­d. géocodé selon la même ) sur la base des données du recensement courant et du recensement précédent
B : Secteur fondé sur les données du recensement courant et vérifié par téléphone auprès de la municipalité
C : Secteur fondé sur les données du recensement courant seulement

CPType 3 (emplacement de l'installation)

A : Adresse du Fichier sur les chefs de ménage géocodée selon le Fichier du réseau routier et appariement avec l'AD du fichier des emplacements de la SCP23
B : Adresse du Fichier sur les chefs de ménage géocodée selon le Fichier du réseau routier
C : Installation localisée selon le fichier des emplacements de la SCP seulement

La précision du secteur codé peut être mesurée dans le contexte du niveau géographique servant au codage, ainsi que du nombre de régions géographiques normalisées codées. Cela est particulièrement pertinent pour le géocodage fondé sur les adresses municipales. Par exemple, les secteurs de service des enregistrements de CPTypes 1 et 2 sont définis selon les tranches d'adresses. Cela signifie qu'au niveau le plus précis, le géocodage sera effectué selon le côté d'îlot, suivi par l‘îlot de diffusion et par l'AD, cette dernière constituant le niveau le moins précis de géocodage. Le nombre d'îlots de diffusion servant au géocodage en proportion du nombre de tranches d'adresses pour un code postal permettra aussi d'indiquer s'il y a eu affectation d'îlots de diffusion inutiles à un code postal. Des mesures de la précision peuvent être utilisées dans le cadre de la vérification du processus de géocodage, ainsi que pour fournir des indicateurs généraux aux utilisateurs des données.

C. Intégralité

Étant donné que les produits fondés sur les codes postaux (FCCP et FCPCEF) fournissent des liens entre les codes postaux et les régions géographiques normalisées, l'intégralité de la couverture de ces produits peut être mesurée de la façon suivante:

  1. Le degré de codage de tous les codes postaux et de leur type selon les régions géographiques normalisées;
  2. La mesure dans laquelle chaque région géographique normalisée habitée se voit affecter un code postal.

Le changement de méthodologie proposé ici permet de coder les codes postaux de CPTypes 3 et 5 en fonction des AD habitées, lorsqu'aucun itinéraire de facteur ou service d'itinéraire n'est disponible. Cela donnera lieu à une couverture plus complète du service postal offert au Canada.

D. Pertinence

Les ventes ainsi que l'utilisation des FCCP et des FCPCEF à Statistique Canada montrent que ce produit est utile. Toutefois, un indicateur du fichier, l'indicateur de lieu unique (ILU), sert à la répartition de la population ou des logements, même s'il n'est pas véritablement destiné à cette fin. L'ILU est conçu pour fournir un point représentatif pour un code postal, aux fins de la mise en correspondance des points d'identification du code postal. Toutefois, cet indicateur est aussi utilisé pour l'affectation des données. Il se peut qu'une région géographique normalisée (îlot de diffusion ou AD) ne soit pas représentative de toute la population ayant accès à ce code postal. Par exemple, un secteur de service de code postal peut englober trois îlots de diffusion, et il se peut qu'un îlot de diffusion ne soit pas plus représentatif que les autres. Il est recommandé que la répartition des données se fasse au moyen du logiciel statistique offert par Statistique Canada (FCCP+) ou d'un autre processus de répartition fondé sur un fichier pondéré de la population des AD24.

E. Intelligibilité et métadonnées

Des métadonnées peuvent être fournies au niveau de l'enregistrement, afin de permettre aux clients de mieux comprendre le couplage des enregistrements. Ces métadonnées contribueront aussi à l'évaluation interne des améliorations qui pourraient être nécessaires dans le géocodage. L'indicateur de qualité (IQ) a été abordé précédemment (dans la section 3.3). Les autres métadonnées proposées au niveau de l'enregistrement sont décrites ci­après.

Méthode de codage

La méthode de codage peut être pertinente selon la qualité du couplage des enregistrements. On propose ce qui suit pour cet indicateur :

  1. Codage manuel confirmé au moyen de cartes;
  2. Codage manuel confirmé par un appel à la municipalité ou aux autorités provinciales compétentes;
  3. Géocodage automatisé;
  4. Géocodage effectué selon les régions géographiques de 2001 et; modifié en fonction des régions géographiques de 2006.

À l'heure actuelle, il est proposé de produire un IQ uniquement pour les enregistrements géocodés de façon automatique. Cet indicateur supplémentaire documente la source des autres types de couplages d'enregistrements. Grâce au contrôle de la qualité de ces autres types de codages, l'IQ pourrait inclure toutes les sources de codage à l'avenir.

Secteurs de service codés

Le code postal peut être codé en fonction du secteur de service du code postal ou d'une installation de livraison, et ces deux types de codage doivent être distingués. On propose ce qui suit pour cet indicateur :

  1. Codé selon le secteur de service du code postal;
  2. Codé selon l'installation de livraison.

TML avec modifications

À l'heure actuelle, lorsque le TML est absent, Statistique Canada attribue un « W ». Ce « W » comprend à la fois les régions rurales et les petites régions urbaines. L'utilisateur peut être en mesure de mieux utiliser le TML si une distinction est faite entre elles. Une autre lettre, comme « S », pourrait être utilisée pour faire une distinction pour les régions de livraison rurale, lorsqu'un enregistrement est de CPType 2 et que la livraison à une adresse municipale est disponible.

Les règles de géocodage et des sources bien définies pour le géocodage permettent la création d'indicateurs de qualité et d'autres métadonnées qui peuvent renseigner l'utilisateur, ainsi que permettre le contrôle de la qualité des fichiers.

Conclusion

Le présent document visait à : 1) étudier les concepts et descripteurs de codes postaux utilisés par la Société canadienne des postes; 2) établir un cadre conceptuel définissant le rapport entre les codes postaux et les régions géographiques normalisées; et 3) définir par la suite des règles opérationnelles pour le couplage des codes postaux et des régions géographiques normalisées.

Les codes postaux peuvent être liés à des régions géographiques normalisées grâce aux secteurs de service de code postal. Même si, dans certains cas, les données sur les adresses disponibles auprès de la Société canadienne des postes sont suffisantes pour géocoder le code postal en fonction du Fichier du réseau routier, des renseignements supplémentaires sont nécessaires dans nombre de cas pour procéder au géocodage. Le recensement fournit un moyen idéal pour faire une distinction entre le secteur de service de la RTA et celui du code postal. Même si cette méthode de géocodage met l'accent sur l'utilisation des codes postaux par les ménages, des codes postaux d'entreprises peuvent aussi être géocodés de cette façon25.

Pour le géocodage du code postal, la première étape consisterait à déterminer le secteur de service de la RTA, sur la base du recensement, et à la compléter par un fichier de concordance de la collectivité de la SCP et de la SDR. Cela permettrait d'établir le secteur de recherche à l'intérieur duquel le code postal peut être géocodé. La différenciation des empreintes géographiques des codes postaux selon le type permet un meilleur codage selon les secteurs deservice de code postal. Un processus de géocodage automatisé fondé sur cette méthode permettra d'assurer l'efficacité du géocodage. Un système efficace de géocodage peut être utilisé au besoin pour profiter des mises à jour des codes postaux, ainsi que des améliorations du réseau routier. En dernier ressort, le cadre conceptuel abordé ici fournit les règles pour un processus de géocodage efficace, y compris des métadonnées sur la qualité de l'enregistrement géocodé.


Notes

1. Les termes en italique sont définis dans le glossaire.

2. La classification de la SCP est considérée comme une composante de la préparation du courrier. La classification est fondée sur le deuxième caractère du code postal, de la façon suivante :

  • code postal urbain : chiffres de 1 à 9 (E2J). Les codes postaux urbains sont généralement desservis par un facteur ou par des boîtes postales communautaires; ou
  • code postal rural : chiffre de 0 (zéro) (A0A). Les codes postaux ruraux sont desservis par des entrepreneurs des routes rurales et/ou des comptoirs postaux

3. Dans le présent document de travail, le terme « recensement » désigne le Recensement de la population.

4. Statistique Canada définit les régions urbaines et rurales, d'après le Recensement de la population, pour les îlots de diffusion, de la façon suivante :

Une région urbaine compte au minimum 1 000 habitants et a une densité de population d'au moins 400 personnes par kilomètre carré, selon les chiffres du recensement courant de la population. L'ensemble du territoire situé à l'extérieur des régions urbaines est classé comme rural. Ensemble, les régions urbaines et rurales couvrent tout le territoire canadien.

5. Les autres 3 % de codes postaux ne sont pas liés à des adresses municipales, mais à des cases postales de bureaux de poste et à des itinéraires de service postal.

6. Ce taux d'appariement est fondé sur l'appariement de noms uniques de SDR à l'intérieur d'une province/territoire et des noms de collectivités de la SCP correspondant aux codes postaux d'une province/territoire (selon la première lettre du code postal). L'appariement a été effectué après uniformisation des noms en lettres majuscules, sans accent ni caractère spécial. Les chiffres du tableau constituent en fait une légère surestimation du taux d'appariement, étant donné que le type de SDR n'a pu être pris en compte dans l'appariement et ne figure pas dans le dénominateur servant au calcul du pourcentage. (Les SDR comportant le même nom, mais un type différent [ville, réserve, district municipal, etc.], comme la ville de Yarmouth et le district municipal de Yarmouth, les deux se trouvant en Nouvelle­Écosse, sont des SDR entièrement différentes. Voir le Glossaire pour une définition du type de SDR.)

7. Il est essentiel de trouver le secteur de service propre à un code postal pour établir un processus de géocodage automatisé. Toutefois, dans le cadre d'un processus de géocodage manuel, il existe des options de recherche de diverses cartes, et même de consultation des municipalités.

8. Ces renseignements sont fondés sur une analyse des données sur les codes postaux tirées de divers documents de la Société canadienne des postes dans le site Internet de la SCP : http://www.postescanada.ca/ et obtenues dans le cadre d'une conversation téléphonique avec un représentant de la Société canadienne des postes, le 17 novembre 2004.

9. Cette liste typologique constitue un regroupement des données fournies pour les enregistrements décrits dans le Fichier technique des données sur les adresses et les codes postaux (Société canadienne des postes, 2005c, pages 6 à 11).

10. Les données du Fichier Recherche d'adresses peuvent servir à trouver l'installation de livraison dans le Fichier sur les chefs de ménage. L'adresse municipale de l'installation de livraison est souvent (mais pas toujours) disponible dans le Fichier sur les chefs de ménage. Les emplacements des installations de livraison sont aussi disponibles auprès de la Société canadienne des postes.

11. Ce code postal, qui comporte des enregistrements de CPTypes 1 et 3 se retrouve dans la version de décembre 2004 du Fichier Recherche d'adresses de la Société canadienne des postes. Il a aussi été confirmé dans l'outil de recherche sur Internet consulté le 30 mai 2005, à l'adresse http://www.postescanada.ca/.

12. Ces renseignements sont fondés sur une conversation téléphonique avec un représentant de la Société canadienne des postes, le 17 novembre 2004.

13. Le TML ne doit pas être confondu avec le CPType du FCCP. Le TML a davantage à voir avec la façon dont le courrier est livré. Le type d'enregistrement du code postal a préséance du point de vue de l'endroit où le courrier est livré. Un cas type est celui d'un gros destinataire de courrier dont le code postal comporte des enregistrements de CPTypes 3 et 1. Un envoi dont l'adresse est formatée comme un enregistrement de CPType 1 (adresse municipale) continuera d'être envoyé à la case postale correspondant au code postal, à condition que le code postal soit exact et qu'il puisse être lu à la machine. (Autrement, la machine tentera de déchiffrer le code postal sur la base des données de l'adresse.) Ce système empêche la livraison de quantités importantes de courrier par un facteur. Le TML est utilisé par les gros envoyeurs de courrier pour obtenir des remises, par suite du tri préliminaire du courrier. (Ces données sont fondées sur une conversation avec un représentant de la SCP, le 27 novembre 2004.)

14. La grande majorité des enregistrements du Fichier Recherche d'adresses sont de CPTypes 1 et 2 et ont trait à la livraison à un logement ou un immeuble particulier. Les autres types d'enregistrements ont trait aux services disponibles à partir de l'installation de livraison.

15. Lorsque les codes postaux d'une autre province ont été déclarés à l'intérieur de l'îlot de diffusion, cela n'a pas été pris en compte dans le géocodage. La méthode de géocodage est expliquée de façon plus détaillée dans la section suivante.

16. À partir des cartes et des données du site Web de la ville d'Ottawa (Ottawa.ca), consulté le 5 juillet 2006.

17. Cela comprend tous les codes postaux du graphique précédent dont les TML sont E, B et G, ainsi que les codes postaux dont le TML est A et qui correspondent à une livraison à une adresse uniquement seulement.

18. La méthode utilisée pour le géocodage des codes postaux en fonction des régions géographiques du Recensement de 2001 est fondée sur l'appariement du nom de collectivité de la SCP et du nom de SDR. Cette méthode pose des problèmes, comme il est indiqué dans la section 1.3. Toutefois, des améliorations sont apportées à l'appariement des noms de SDR et sont abordées plus loin dans l'annexe C.

19. Lorsque des changements à grande échelle touchent à l'occasion les secteurs de RTA, ils sont signalés par la SCP.

20. Pour la vérification des secteurs de service de RTA (mentionnée dans la section 2.2), un îlot de diffusion du Recensement de 2001 est attribué à un secteur de service uniquement si un minimum de quatre répondants ont déclaré des codes postaux comportant cette RTA dans cet îlot. Le choix d'un nombre minimum de réponses pour une RTA est fondé sur l'hypothèse que la probabilité est plus faible que quatre personnes fassent la même erreur en déclarant la RTA dans le même îlot que celle d'une personne de faire l'erreur dans le même îlot. Malgré l'utilisation de ce critère conservateur, le taux de géocodage a été supérieur à 88 % pour les enregistrements d'adresses municipales de CPTypes 1 et 2.

21. D'après la vérification des secteurs de service de la RTA mentionnée précédemment, les secteurs de service n'ont pu être élaborés pour tous les codes postaux, ces derniers n'ayant pas tous été utilisés.

22. Une liste de correspondance entre les noms de collectivités de la SCP et les SDR a été créée pour la recherche d'adresses municipales dans le cadre du processus de géocodage manuel. Voir l'annexe C pour plus de détails sur les améliorations apportées à ce fichier de correspondance.

23. Un fichier d'emplacement de l'installation de livraison a été obtenu de la SCP en janvier 2006.

24. Le logiciel Fichier de conversion des codes postaux Plus (FCCP+) est un produit complémentaire du Fichier de conversion des codes postaux (FCCP). Il s'agit d'un système automatisé qui utilise les codes postaux pour attribuer les régions géographiques du recensement. FCCP+ est fondé sur le Fichier de conversion des codes postaux le plus récent et sur le Fichier de la pondération de la population par codes postaux produit par la Division de la géographie de Statistique Canada. FCCP+ utilise des poids pour affecter les codes postaux liés à des aires de diffusion multiples, selon la répartition de la population en fonction d'un code postal donné.

25. Les auteurs suggèrent que l'utilisation des codes postaux par les entreprises, ainsi que les comparaisons de l'empreinte du secteur de service du code postal pour le Recensement de 2001 et de celle du Recensement de 2006, soient explorées dans un document de travail subséquent.


Page d'accueil | Recherche | Contactez-nous | English
Haut de la page
Date de modification : 2007-02-14 Avis importants
Catalogue en ligne Page principale Discussion Tableaux et figures Annexes Glossaire Références Renseignement supplémentaires PDF version _satellite.pageBottom(); >