Consulter la version la plus récente.
L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.
DiscussionRésumé RésuméStatistique Canada crée des fichiers qui fournissent le couplage entre les codes postaux et les régions géographiques selon lesquelles les données statistiques sont diffusées. En couplant les codes postaux et ses régions géographiques, Statistique Canada facilite l'extraction et l'agrégation subséquente de données pour certaines régions géographiques de fichiers mis à la disposition des utilisateurs. Les utilisateurs peuvent alors totaliser les données de Statistique Canada pour leurs régions et d'autres données pour ces mêmes régions de manière à établir un profil statistique combiné de ces régions. La méthodologie utilisée par Statistique Canada pour le couplage des codes postaux et des régions géographiques a été questionnée. Pour régler la situation, Statistique Canada a décidé de créer un cadre conceptuel pour l'élaboration des règles régissant le couplage des codes postaux et des régions géographiques de Statistique Canada. Le présent document de travail expose le cadre conceptuel et les règles de géocodage. La méthodologie qui y est décrite servira de fondement pour le couplage des codes postaux aux régions géographiques du Recensement de 2006. Les utilisateurs des produits de Statistique Canada qui font appel aux codes postaux sont invités à formuler des commentaires sur le présent document. IntroductionLe présent document comporte deux objectifs : 1) établir un cadre conceptuel définissant le rapport entre les codes postaux et les régions géographiques; et 2) définir par la suite des règles pour le couplage des codes postaux et des régions géographiques normalisées1. Les codes postaux sont gérés par la Société canadienne des postes (SCP) et servent au tri et à la livraison efficace du courrier. Ils ne sont pas créés comme unités pour l'analyse ou la mise en correspondance de caractéristiques de populations, d'entreprises ou de logements. Les produits fondés sur les codes postaux créés par Statistique Canada servent de lien entre les codes postaux et les régions géographiques normalisées, afin de permettre diverses utilisations des données. De façon générale, les utilisations des produits fondés sur les codes postaux peuvent être caractérisées de la façon suivante :
Unité statistique Une unité statistique est l'unité d'observation ou de mesure pour laquelle des données sont recueillies ou calculées. L'unité statistique de base pour les statistiques sociales est la personne, qui sert d'unité d'analyse dans le cadre de la plupart des programmes de statistiques sociales. Parmi les autres unités utilisées dans les statistiques sociales figurent le logement et le ménage. L'association entre les codes postaux et les régions géographiques normalisées est actuellement comprise dans les produits suivants : 1) le Fichier de conversion des codes postaux (FCCP) et 2) le Fichier des codes postaux par circonscriptions électorales fédérales (FCPCÉF). Le FCCP permet d'assurer le couplage des codes postaux et de la plupart des régions géographiques normalisées, y compris les entités détaillées suivantes : côté d'îlot, îlot de diffusion et aire de diffusion. Le FCCP est le principal produit répondant aux exigences des applications mentionnées précédemment. Au fil des ans, un certain nombre de problèmes se sont posés relativement à la qualité du FCCP, ce qui a entraîné la remise en question des concepts fondamentaux qui soustendent la façon dont les codes postaux sont couplés aux régions géographiques normalisées. Il s'agit de problèmes comme l'utilisation appropriée des données pour le couplage des codes postaux, la précision et l'exactitude des couplages, et l'attribution d'indicateurs de lien unique. Le suivi de ces problèmes de qualité du FCCP a fait augmenter les coûts déjà élevés du géocodage des codes postaux. Ces problèmes ont fait ressortir la nécessité d'examiner et d'établir un cadre conceptuel définissant le rapport entre les codes postaux et les régions géographiques normalisées, en vue de rétablir les règles opérationnelles servant au couplage des codes postaux et des régions géographiques normalisées, ainsi qu'à l'élaboration subséquente des produits. Le couplage des codes postaux et des régions géographiques a posé des difficultés dans les cas suivants :
Le présent document de travail repose sur l'hypothèse selon laquelle une meilleure utilisation des données sur les codes postaux recueillies dans le cadre du recensement ainsi que des données des fichiers de la SCP contribuera à résoudre les problèmes décrits précédemment et permettra d'obtenir des couplages plus précis entre les codes postaux et les régions géographiques normalisées. Des règles doivent être élaborées pour géocoder les codes postaux selon les régions géographiques normalisées de Statistique Canada, afin d'améliorer le couplage. Le géocodage peut être défini comme le processus d'attribution d'identificateurs géographiques (codes), en vue de la mise en correspondance des traits physiques et des enregistrements de données. Les codes géographiques en résultant permettent le couplage géographique des données. Par exemple, l'une des façons de géocoder une adresse municipale au Canada consiste à localiser d'abord la région générale, puis l'immeuble particulier comportant cette adresse municipale. Étant donné que les mêmes noms de rue ou adresses municipales peuvent se retrouver dans de nombreuses régions au Canada, il est essentiel de pouvoir limiter la recherche d'une combinaison de nom de rue et d'adresse municipale à un lieu particulier au Canada. Le terme « secteur de recherche » sera utilisé dans le présent document pour désigner la région géographique à l'intérieur de laquelle le géocodage peut être effectué à partir des noms de rue et des adresses municipales. Le processus de géocodage d'une adresse municipale peut par conséquent être décrit de la façon suivante : Étape 1 : Établir le secteur de recherche. Étape 2 : Trouver le secteur de recherche dans le Fichier du réseau routier. Étape 3 : Trouver la rue dans le secteur de recherche du Fichier du réseau routier. Étape 4 : Trouver l'adresse dans une tranche d'adresses d'une rue. Étape 5 : Établir les codes géographiques. (Les codes géographiques utilisés sont le côté d'îlot, l'îlot de diffusion et l'aire de diffusion.) Le processus de géocodage décrit précédemment servira de modèle général pour établir les règles opérationnelles de géocodage des codes postaux. Le processus de géocodage des codes postaux permet ultimement de créer le lien entre les codes postaux et les codes géographiques, soit le côté d'îlot, l'îlot de diffusion et l'aire de diffusion. Le lien entre les codes postaux et toutes les autres régions géographiques normalisées est fondé sur ce géocodage initial. Le présent document de travail vise les objectifs suivants :
On s'attend à ce que les règles de géocodage et les recommandations d'indicateurs de la qualité puissent être utilisées pour créer les produits. 1.0 Typologie des codes postaux et localisationL'examen de la structure et de la typologie des codes postaux constitue la première étape en vue de comprendre comment ils peuvent être liés à des régions géographiques normalisées. Certaines des définitions pertinentes, de même que les types et les occurrences, sont examinées dans la présente section. Cela sert de base aux règles opérationnelles de géocodage des codes postaux (voir la section 3.0). 1.1 Le code postal et la localisationLes codes postaux sont gérés par la SCP. Ils ont été conçus pour aider à trier rapidement le courrier et à assurer la livraison plus efficace des lettres, colis et autres envois par la SCP. Un code postal peut être lié à différents types de points de livraison, y compris des boîtes aux lettres résidentielles, des boîtes postales multiples, ainsi que des cases postales de bureaux de poste (voir www.postescanada.ca). Les caractères qui constituent le code postal sont généralement représentatifs de l'utilisation prévue (livraison) du code postal. La Société canadienne des postes définit un code postal de la façon suivante : Une combinaison alphanumérique de six caractères (ANA NAN) attribuée à une ou plusieurs adresses postales. Le code postal fait partie intégrante de toutes les adresses postales au Canada et est nécessaire pour le traitement mécanisé du courrier. Les codes postaux servent aussi à identifier les diverses installations de traitement et de livraison de la SCP (Société canadienne des postes, 2005a, page 30). Les trois premiers caractères du code postal (combinaison alphanumérique de « ANA ») correspondent à la région de tri d'acheminement (RTA). Cette dernière est définie de la façon suivante : La région de tri d'acheminement ou RTA représente une zone précise au sein d'une province ou d'une zone géographique importante. La région de tri d'acheminement constitue le fondement du tri primaire du courrier d'acheminement (Société canadienne des postes, 2007, section B, Chapitre 3, page 8). Les trois derniers caractères du code sont appelés unité de distribution locale (UDL). Ils permettent la création de codes postaux individuels à l'intérieur du secteur de service de la RTA. Chacune des premières lettres du code postal est réservée à une province/un territoire particulier du pays (voir l'annexe A pour plus de détails). De façon plus particulière, selon les dossiers de la SCP, le premier caractère correspond à la province/au territoire de l'installation de livraison à partir de laquelle le service lié au code postal est assuré. Le deuxième caractère du code postal correspond à la couverture de ce code. Un code postal comportant un « 0 » comme deuxième caractère est classé comme « rural », et tous les autres codes postaux sont considérés comme urbains par la Société canadienne des postes2. Toutefois, cela ne signifie pas que le code postal correspond aux « régions rurales » ou « régions urbaines » définies selon les chiffres de population du recensement courant3,4. Ils peuvent être désignés comme des codes postaux desservant des secteurs de livraison rurale et des secteurs de livraison urbaine, afin d'éviter la confusion avec les termes « régions rurales » et « régions urbaines » utilisés par Statistique Canada. Par exemple, le NouveauBrunswick ne compte aucun secteur de livraison rurale, même si Statistique Canada considère cette province comme rurale pour une large part. Dans le cas des codes postaux liés à des secteurs de livraison rurale, le Guide des postes du Canada indique ce qui suit : « … lorsqu'ils sont combinés à la région de tri d'acheminement, les trois derniers caractères désignent une collectivité rurale précise » (Société canadienne des postes, 2007, section B, chapitre 3, page 10). Les collectivités doivent être localisées sur une carte, afin de pouvoir être géocodées selon les régions géographiques normalisées. Des cartes sont disponibles auprès de la SCP et correspondent au secteur représenté par une RTA. Toutefois, les personnes vivant dans une province peuvent utiliser un code postal lié à une autre province, et les personnes vivant dans une RTA peuvent utiliser le code postal d'une autre RTA. Cela signifie que le secteur desservi par le code postal ou la RTA peut être différent des limites administratives créées par la Société canadienne des postes. En outre, l'échelle de ces cartes (1:50 000 à 1:12 000 000) rend difficile le lien entre les limites des RTA et le réseau routier plus détaillé du cadre géographique de Statistique Canada. Même si ces cartes sont utiles pour la localisation de la RTA à l'intérieur d'une province, elles ne nous renseignent pas sur la portée de la RTA en rapport avec un réseau routier disponible dans le public, et ne comprennent pas non plus les renseignements plus détaillés nécessaires pour le géocodage des codes postaux. Toutefois, les cartes des itinéraires de facteurs (IF) disponibles récemment sur Internet (généralement pour les secteurs de livraison urbaine) présentent les limites des RTA dans le contexte du réseau routier. Elles peuvent être plus utiles que les cartes des RTA pour déterminer les limites de nombreuses RTA. Toutefois, elles ne permettent pas de délimiter le secteur desservi par un code postal. Le code postal proprement dit n'est pas suffisant pour déterminer l'emplacement exact et la couverture du secteur de service. La RTA peut être utilisée pour localiser le secteur général desservi par les codes postaux pertinents. Des renseignements provenant d'autres sources sont nécessaires pour associer le code postal et des régions géographiques normalisées particulières. 1.2 Données sur les adresses et la livraison tirées des fichiers de la SCPLa SCP fournit des renseignements sur les codes postaux dans le contexte des différents aspects de la livraison du courrier. Ces renseignements sont pertinents du point de vue de la façon dont ces codes postaux se rejoignent géographiquement et dont ils peuvent être consultés par les personnes et les institutions qui utilisent le système postal. Les typologies et les données de localisation décrites dans le présent document sont tirées des données fournies sur une base mensuelle par la SCP à Statistique Canada, dans les fichiers suivants.
Il s'agit des trois fichiers les plus pertinents pour le géocodage des codes postaux. Parmi eux, le Fichier Recherche d'adresses, qui comprend les données sur les adresses liées à la grande majorité des codes postaux, est le plus utile pour le géocodage. 1.3 Fichier Recherche d'adressesLe Fichier Recherche d'adresses fournit un tableau complet des codes postaux actifs (y compris les mises à jour et les 500 à 2 500 nouveaux codes postaux adoptés ou « créés » chaque mois). Parmi les 1 144 108 enregistrements figurant dans le Fichier Recherche d'adresses de juin 2006, 1 133 814 étaient « actifs » ou valides pour le service postal. Les autres codes postaux du fichier sont ceux qui sont « retirés » au cours du mois en question. Statistique Canada utilise le terme « code postal retiré » pour décrire tous les codes postaux qui étaient actifs à un moment donné, mais ne le sont plus. Même si la Société canadienne des postes considère uniquement les codes postaux actifs comme valides pour le service postal, les codes postaux retirés peuvent être utilisés un certain temps après leur retrait. Nom de collectivité de la SCP dans le Fichier Recherche d'adresses L'identification de la municipalité desservie par un code postal constitue une étape initiale importante pour déterminer avec précision où le code postal devrait être géocodé. Le premier caractère du code postal (qui indique la province ou le territoire), combiné au nom de collectivité de la SCP permet parfois, mais pas toujours, de repérer la municipalité ou la subdivision de recensement (SDR) à partir de laquelle le code postal peut être géocodé. Lorsque la SDR peut être localisée, les données sur l'adresse municipale peuvent servir au géocodage en fonction d'une tranche d'adresses municipales. Le terme « municipalité » dans le Fichier Recherche d'adresses ne correspond pas nécessairement à la municipalité définie par la loi au moment où la Société canadienne des postes publie les données. Il s'agit de noms utilisés au niveau local, afin de prévenir la confusion en ce qui a trait au secteur desservi. Le secteur desservi ne coïncide pas nécessairement avec les municipalités légalement constituées ayant le même nom ou un nom similaire. Par exemple, lorsque des municipalités sont fusionnées, la Société canadienne des postes préserve les anciens noms (avant la fusion), jusqu'à ce qu'elle puisse établir que les différentes rues comportent un nom unique dans la nouvelle municipalité fusionnée. La RTA est aussi définie en rapport avec une municipalité de la façon suivante : La RTA comprend les trois premiers caractères d'un code postal. La RTA qualifie la zone, à l'intérieur d'une municipalité, qui est autorisé à utiliser le nouveau nom valide de municipalité (Société canadienne des postes, 2005a, page 33). Ces noms de municipalités sont souvent des noms de lieux qui n'existent plus ou des noms couramment utilisés en rapport avec ces localités. Afin d'éviter toute confusion, on utilisera ciaprès le terme « collectivité de la SCP ». La comparaison des noms de municipalités utilisés en janvier 2001 illustre ce point. Les SDR de Statistique Canada comprennent toutes les municipalités définies par la loi qui existaient en date du 1er janvier de l'année du recensement (2001). Une comparaison des noms de collectivité de la SCP existants montre que moins de 40 % d'entre eux correspondent aux SDR. Le tableau qui suit illustre les appariements de noms de collectivités de la SCP et de noms de SDR de 20016 : Tableau 1 Appariement des noms de collectivités de la Société canadienne des postes et des noms des subdivisions de recensement (SDR) du Recensement de 2001 Le taux d'appariement dans le tableau qui précède est d'environ 40 %, en dépit du traitement (uniformisation) assuré pour l'augmenter. L'examen du Fichier Recherche d'adresses de juin 2001 montre les changements qui se sont produits par suite des fusions. Par exemple, Nepean et Ottawa ont été conservés comme noms de collectivités de la SCP, même si Nepean n'existe plus légalement comme municipalité par suite de la fusion. Les noms de rues et les noms de collectivités de la SCP semblent être mis à jour dans le Fichier Recherche d'adresses pour rendre compte des changements qui se sont produits au niveau municipal, une fois que la SCP a résolu la question du caractère unique de l'adresse. Cela peut expliquer l'augmentation légère des taux d'appariement sur quatre ans. Toutefois, aux fins du géocodage, un fichier de correspondance entre les noms de SDR et de collectivités de la SCP est nécessaire, afin que le géocodage puisse être ramené au niveau de la SDR en premier lieu, puis au niveau de l'adresse municipale à l'intérieur de celleci7. Malheureusement, même lorsque les noms de SDR correspondent, il faut plus de renseignements pour définir le secteur à l'intérieur duquel les données sur les adresses municipales peuvent être appariées de façon unique. Il se peut que plus d'une rue aient le même nom à l'intérieur d'une SDR. Le même code postal peut parfois être attribué à plusieurs SDR. Le géocodage possible à l'intérieur de collectivités de la SCP multiples devrait être envisagé. Le nom de collectivité de la SCP peut être un outil utile pour localiser les municipalités où se trouve l'adresse municipale. Parfois, une correspondance peut être établie entre la SDR et le nom de collectivité de la SCP sur la base de la province/territoire et des similitudes entre les noms. Toutefois, en raison des différentes dates de référence et des objectifs visés par le nom de SDR et le nom de collectivité de la SCP, cette correspondance n'est pas toujours possible et, même lorsqu'elle est établie, ne peut être effectuée avec un niveau de confiance absolu. Des données supplémentaires sont nécessaires pour établir le secteur à l'intérieur duquel l'adresse municipale peut se retrouver. Types de codes postaux dans le Fichier Recherche d'adresses Une fois que la municipalité ou le secteur général desservi par le code postal est établi, le secteur de service propre au code postal doit être défini avant le géocodage. Les types d'enregistrements du Fichier Recherche d'adresses sont essentiels pour établir le type de secteur de service du code postal. La Société canadienne des postes désigne cinq types d'enregistrements dans le Fichier Recherche d'adresses8. Ils sont liés à cinq types différents de livraison. Ces enregistrements sont catégorisés et appelés « CPType » dans le FCCP. La typologie est la suivante9 :
Un code postal peut être lié à plus d'un CPType d'enregistrement. Chaque enregistrement du Fichier Recherche d'adresses de juin 2006 comporte un code postal et un type particulier. Comme le montre le graphique cidessous, la grande majorité des enregistrements sont de CPType 1 ou 2. Les secteurs de service des enregistrements de CPTypes 1 et 2 sont définis en fonction des adresses municipales. Les adresses municipales (de voirie) sont essentiellement celles qui se trouvent sur la façade des logements ou des immeubles. Comme on peut le voir précédemment, les CPTypes d'enregistrements correspondant aux adresses municipales constituaient 98 % des enregistrements du Fichier Recherche d'adresses en juin 2006. La plupart des côtés d'îlots urbains et de nombreuses rues résidentielles dans les régions urbaines ne comportent généralement qu'un code postal correspondant à l'adresse municipale. Même s'il peut être difficile de trouver la collectivité de la SCP et de localiser la ou les régions géographiques normalisées pour un code postal, les secteurs de service de ces codes postaux peuvent être considérés comme complètement définis dans les données sur les adresses fournies par la Société canadienne des postes. Dans ce cas, le géocodage est simple si le nom de rue et les données sur les adresses peuvent être appariés aux données de la même date de référence dans le cadre géographique de Statistique Canada. Aucune donnée sur les adresses municipales des secteurs de service n'est fournie pour les CPTypes d'enregistrements 3, 4 et 5. Les secteurs de service de ces codes postaux ne sont pas directement définis dans le Fichier Recherche d'adresses. Dans le cas du CPType 3, le Fichier Recherche d'adresses fournit les codes postaux de cases postales ou de tranches de numéros de cases postales à l'intérieur d'une installation de livraison. Tous les codes postaux peuvent être couplés avec l'installation qui les dessert10. On peut au moins coder les codes postaux des enregistrements de CPTypes 3, 4 et 5 en fonction de la SDR où l'installation de livraison est située (si l'adresse de l'installation de livraison peut être géocodée). Dans le cas des enregistrements de CPType 4, il est parfois possible d'obtenir les noms des itinéraires desservis. Il s'agit notamment de la livraison selon des routes bien définies dans des régions rurales établies, ainsi que des livraisons à des parcs industriels et à des groupes de boîtes postales. Pour les enregistrements de CPType 5, les seuls renseignements disponibles sont le nom de collectivité de la SCP du secteur desservi. Dans tous les cas, le secteur de service n'est pas nécessairement celui où l'installation de livraison est située, et le secteur de service n'est pas défini en fonction des tranches d'adresses municipales. En résumé, les codes postaux de CPTypes 3, 4 ou 5 (contrairement aux CPTypes 1 et 2) ne comprennent pas d'empreinte géographique précise permettant une association directe et complète avec les fichiers géographiques de Statistique Canada. D'autres sources de données décrivant les modèles d'utilisation doivent être examinées pour décider de la façon de répartir les secteurs de service pour ces codes postaux et de géocoder ces codes postaux à partir des données disponibles. Du fait de l'urbanisation accrue et du plus grand nombre d'adresses municipales, la proportion d'enregistrements de CPType 2 a augmenté légèrement. Le tableau ciaprès illustre les changements au fil du temps. Tableau 2 Changements dans les combinaisons de type de codes postaux dans le Fichier Recherche d'adresses Même si le pourcentage de chaque CPType de code postal urbain est demeuré constant, le pourcentage de codes postaux comprenant CPType 2 a connu une légère hausse dans les secteurs de livraison rurale. La légère augmentation de la proportion de codes postaux comportant des enregistrements de tranches d'adresses municipales pourrait entraîner une légère hausse de la proportion de codes postaux pouvant être géocodés selon une tranche d'adresses municipales. Comme on peut le voir, un code postal peut comporter plus d'un CPType d'enregistrement. Cela se produit généralement dans les régions considérées comme « rurales » par la Société canadienne des postes. Les enregistrements de CPType 2 ne viennent jamais seuls, et s'accompagnent toujours d'enregistrements de CPTypes 3, 4 et 5. Au fil du temps, la proportion de codes postaux comportant des enregistrements de CPType 2 continue d'augmenter. Cela pourrait constituer une indication de l'augmentation du nombre d'adresses municipales, particulièrement dans les endroits où le service était associé à un itinéraire (CPType 4). Par exemple, le code postal K7V3Z8 est associé à un code postal se trouvant sur un itinéraire de distribution (CPType 4). Toutefois, il contient également des enregistrements de CPType 2 auxquels des adresses municipales sont liées. Les régions très rurales ont tendance à comporter uniquement enregistrements de CPTypes 5 et/ou 3. Les enregistrements de CPType 1 se retrouvent dans des régions urbaines et ont tendance à être isolés, sauf dans quelques cas où ils sont liés à des enregistrements de CPType 3. Un exemple de ce genre de situation est le code postal K1A 9Z611. Il est lié à une case postale et à un ensemble d'adresses municipales. L'enregistrement d'adresse municipale (CPType 1) permet de compléter l'information grâce à l'adresse de l'installation de livraison (CPType 3) pour le même code postal12. Effectivement, ces codes postaux comportent deux CPTypes, mais se rapportent à un seul immeuble (ou entreprise) qui reçoit du courrier. Le secteur de service d'un code postal peut être considéré comme correspondant à un secteur où des personnes ont accès au courrier grâce à ce code postal. Dans le cas des codes postaux de CPTypes 1 et 2, il s'agit de logements et d'immeubles desservis par la poste selon leur adresse municipale. Dans le cas des codes postaux de CPType 4, il s'agit de tous les secteurs qui sont desservis par un itinéraire de distribution du courrier. Dans le cas des codes postaux de CPTypes 3 et 5, il s'agit de logements et d'immeubles dont les occupants ont généralement accès au service de livraison postale par l'entremise d'une installation de livraison. Le secteur de service d'un code postal individuel comprend chacun de ces types d'enregistrements. L'examen des combinaisons de types d'enregistrements liés à chaque code postal peut aider à déterminer si et comment la couverture de ces secteurs de service se chevauche. Cela permet de décider si certains enregistrements sont plus représentatifs de l'empreinte géographique du code postal. Certains types d'enregistrements peuvent être considérés comme plus représentatifs du secteur de service définitif lié à ce code postal. Par exemple, le CPType 1 est plus représentatif d'un immeuble/logement particulier desservi que le CPType 5. Le CPType 4 est représentatif d'itinéraires particuliers desservis, tandis que le CPType 5 n'est pas davantage lié à un emplacement particulier qu'à un autre à l'intérieur de la collectivité de la SCP (sur la base des données sur les adresses disponibles). Comme il est indiqué précédemment dans la présente section, lorsqu'un enregistrement de type 1 et un enregistrement de CPType 3 correspondent au même code postal, l'enregistrement de CPType 1 comprend l'adresse des utilisateurs du service postal. Cela laisse supposer que les enregistrements les plus représentatifs de la couverture des codes postaux seraient les suivants :
Les CPTypes 2 et 4 peuvent couvrir le même secteur. Le secteur desservi par un itinéraire de distribution (CPType 4) peut être assez précis, même s'il ne peut être localisé sur la base des données sur les adresses du Fichier Recherche d'adresses. Ces données ne sont pas suffisantes pour décider lequel de ces enregistrements (CPType 2 ou 4) est le plus représentatif. Toutefois, le CPType 2 peut avoir préséance sur le CPType 4 dans le processus de géocodage, comme étant plus représentatif, étant donné qu'il est probable qu'il sera mieux géocodé (compte tenu des données particulières sur les adresses), et qu'il représente aussi probablement une partie de la couverture des enregistrements de CPType 4, par suite des progrès réalisés au chapitre des adresses municipales. Essentiellement, lorsque plus d'un type d'enregistrement est lié à un code postal, le type d'enregistrement peut être utilisé comme un des critères pour choisir l'indicateur le plus représentatif de l'empreinte spatiale de ce code postal. Une fois que la collectivité de la SCP a été appariée à une SDR, les enregistrements de CPTypes 1 et 2 peuvent être géocodés sur la base des données sur les adresses municipales, mais le manque de données sur les adresses municipales pour les types 3, 4 et 5 rend leur codage presque impossible à un niveau plus précis que la SDR. Étant donné que le but visé est de mettre en correspondance l'ensemble des empreintes de codes postaux, de plus amples renseignements sont nécessaires dans les cas où les codes postaux comportent des enregistrements de CPTypes 3, 4 et 5. Les types d'enregistrements peuvent aussi être utilisés comme facteurs pour déterminer le couplage le plus représentatif de codes postaux et de régions géographiques normalisées. En conclusion, le type d'enregistrement est essentiel pour déterminer la nature de l'empreinte du secteur de service du code postal. Enregistrements des codes postaux et couverture de la région géographique Il se peut qu'un code postal qui correspond spécifiquement à des tranches d'adresses municipales couvre plus d'un côté d'îlot ou îlot. Par conséquent, lorsqu'un code postal du Fichier Recherche d'adresses est lié à plus d'un enregistrement, chacun comportant sa propre tranche d'adresses, cela peut légitimement mener à la couverture de plus d'un côté d'îlot (ou îlot de diffusion). Cela est également possible si une tranche d'adresse unique provenant du Fichier Recherche d'adresses couvre plus d'un côté d'îlot ou un côté d'îlot de diffusion. Le tableau cidessous montre le nombre d'enregistrements du Fichier Recherche d'adresses liés à chaque combinaison de type d'enregistrement et de code postal. Tableau 3 Nombre d'enregistrements selon le type d'enregistrement dans le Fichier Recherche d'adresses – Juin 2001 et juin 2006 L'examen du tableau qui précède montre que même si les enregistrements de type 1 sont liés à une tranche d'adresses environ 70 % du temps, ils couvrent parfois plus de 50 tranches d'adresses (potentiellement 50 côtés d'îlots ou îlots de diffusion). Selon notre expérience du géocodage des enregistrements de CPTypes 1 et 2, lorsqu'un code postal comprend plus d'un enregistrement de tranche d'adresses municipales, la couverture porte sur des côtés d'îlot consécutifs ou adjacents. Les enregistrements de CPType 2 semblent comporter le nombre le plus important de tranches d'adresses définies. Les enregistrements de CPType 4 comportent des itinéraires et ceuxci peuvent couvrir de grands secteurs, même si les enregistrements de ce type ne sont pas très nombreux dans le Fichier Recherche d'adresses. Les enregistrements de CPType 3 sont généralement liés à une ou plusieurs cases postales d'une installation de livraison, et un enregistrement seulement est lié à l'installation. De même, le CPType 5 a trait à la livraison qui est disponible à partir d'une installation et peut comporter un seul enregistrement. Il convient de mentionner ici que pour les enregistrements de CPType 1, et particulièrement ceux de CPType 2, il se peut qu'aucun enregistrement géocodé (côté d'îlot ou îlot) ne soit plus représentatif qu'un autre du code postal, du point de vue du service fourni. 1.4 Fichiers de localisation des installations de livraisonLes codes postaux de CPTypes 3 et 5 sont liés à la cueillette du courrier dans une installation de livraison (plutôt qu'à sa livraison à une adresse municipale). Les adresses municipales liées à l'installation de livraison sont disponibles dans le Fichier sur les chefs de ménage. Les emplacements de ces installations de livraison ont aussi été obtenus récemment auprès de la SCP par Statistique Canada. Les emplacements ne correspondent pas toujours aux coordonnées du Fichier du réseau routier de Statistique Canada. Cela signifie que lorsque des données sur les adresses sont disponibles et peuvent être appariées aux données figurant dans le Fichier du réseau routier, il est plus approprié de procéder au géocodage à partir de celuici, afin que l'emplacement de l'installation par rapport aux données du réseau routier soit le plus précis possible. Lorsque des données sur les adresses ne sont pas disponibles, l'adresse de l'emplacement du bureau de poste peut être confirmée auprès de la Société canadienne des postes. Statistique Canada tiendra à jour une liste des adresses d'installations de livraison et des îlots de diffusion connexes, afin de permettre le géocodage des codes postaux. Dans la section 2.0, on tente de déterminer si certains codes postaux devraient être liés à l'installation de livraison seulement. 1.5 Type d'enregistrement et type de mode de livraison à partir du Fichier sur les modes de livraisonLe type de mode de livraison (TML) comprend des détails sur le service de livraison offert13. Il sert à calculer les taux pour les services postaux (Société canadienne des postes, 2005c, page 2). La description et la typologie de la SCP sont les suivantes : A = Livraison à une adresse à l'intérieur d'un côté d'îlot Le type de mode de livraison peut être utile pour illustrer si le géocodage s'applique à un immeuble particulier, soit peut‑être un « sous‑ » côté d'îlot. Comme le montre le tableau ciaprès, dans quelques cas, les enregistrements de codes postaux peuvent être liés à un immeuble particulier. Tableau 4 Enregistrements de type 1 à partir du Fichier Recherche d'adresses de juin 2006 et TML tiré du Fichier sur les modes de livraison de juin 2006 Comme on peut le voir, les combinaisons les plus fréquentes de TML et de CPType sont liées à des tranches d'adresses bien définies (TML = « A »). Les autres CPType 1 sont liés à des immeubles d'appartements (TML = « B ») et à différents types d'entreprises (TML = « E » et « G »). La majeure partie du géocodage des enregistrements de CPType 1 peut simplement être effectuée à partir des données sur les adresses. Toutefois, il est particulièrement important que les immeubles comportant des populations importantes soient géocodés de façon appropriée. Par exemple, un immeuble peut correspondre à un établissement de santé qui représente un îlot, une aire de diffusion ou une subdivision de recensement (SDR) complets. Dans de rares cas où une SDR complète est représentée dans un établissement, sa population peut être équivalente à l'ensemble de la population de la SDR. Pour les codes postaux de CPType 1, le TML permet de faire une distinction entre le type d'immeuble (logement, appartement, gros destinataire de courrier, etc.) qui est représenté par le code postal. Le TML ne comprend pas plus de renseignements que le type d'enregistrement pour localiser tous les types de codes postaux d'après les données sur les adresses, bien qu'il donne de l'information sur le genre d'immeuble qui reçoit le courrier. 1.6 Considérations relatives au géocodage fondé sur les données de la SCPCes considérations relatives au géocodage font suite à l'examen des données de la SCP de la présente section. Ces considérations, de pair avec les conclusions de la section suivante sur la façon dont les codes postaux sont utilisés et déclarés, permettront d'élaborer les règles du géocodage. Les considérations relatives à l'élaboration des règles de géocodage sont les suivantes :
En conclusion, des données supplémentaires sur les secteurs desservis par le code postal sont nécessaires pour élargir et valider le géocodage partiel qui peut être effectué à partir des fichiers de la SCP seulement. 2.0 Utilisateurs des codes postaux et géographieAprès examen des données sur les codes postaux dans la section précédente, le défi principal subsiste : comment élaborer un secteur de recherche à partir duquel le code postal peut être géocodé. Les noms de collectivités de la SCP représentent des noms de lieux qui ne correspondent habituellement pas aux noms ou aux limites des SDR du cadre géographique de Statistique Canada. Dans la section qui précède, la discussion sur l'utilisation des fichiers de la SCP pour le géocodage a montré que des données supplémentaires sont nécessaires. Les questions de fond qui restent sans réponse sont les suivantes :
Les renseignements supplémentaires dont il est question ici sont des renseignements fondés sur l'utilisation déclarée du code postal. Le secteur où le code postal est utilisé est appelé secteur de service du code postal. Les secteurs de service, sur la base des codes postaux déclarés dans le Recensement de la population, fournissent les renseignements supplémentaires nécessaires pour assurer et confirmer le géocodage. Cela s'ajoute à la recherche de la SDR, sur la base du nom de collectivité de la SCP. Des améliorations à ce processus sont examinées à l'annexe C. La présente section met l'accent sur la façon dont les personnes ou les ménages utilisent les codes postaux, et comment ceux‑ci viennent compléter et confirmer les données sur les adresses de la SCP. Les utilisateurs des codes postaux sont des personnes et des entreprises. Toutefois, le rapport entre ces unités statistiques et les codes postaux est indirect. Comme il est indiqué dans la section précédente, les codes postaux ne sont pas attribués à des personnes ou des entreprises, mais bien à des immeubles et des logements14. L'exception à cette règle est le fait que moins de 2 % des enregistrements d'adresses de codes postaux ont un type de mode de livraison « G » ou « M », lesquels sont associés à un gros destinataire de courrier. Une source de données est aussi nécessaire pour déterminer le secteur de service de cette façon. Dans le cas des personnes, les rapports suivants doivent exister entre les sources de données : Essentiellement, le rapport de la personne avec le code postal et la région géographique normalisée peut servir à faire le lien entre ces derniers. Même si une telle source de données est disponible pour le code postal, la question subsiste quant à la région géographique normalisée liée à ce code postal. Par exemple, il y aurait un risque que la région géographique normalisée attribuée dans la source des données ne corresponde pas à celle du domicile de la personne, mais soit liée à la région géographique normalisée de travail. Ces risques doivent être équilibrés du point de vue de la façon dont les personnes et les entreprises utilisent les codes postaux. 2.1 Personnes et codes postaux déclarés dans le recensementLe Recensement de la population est la seule source comprenant un code postal déclaré et la région géographique normalisée pour toutes les personnes au Canada. Les ménages au Canada doivent déclarer (ou confirmer) leur code postal dans le formulaire de recensement. Ce code postal de répondant correspond généralement au code postal de la résidence du ménage. Il peut être utilisé pour estimer le secteur de service d'un code postal. Un ménage est généralement défini comme étant constitué d'une personne ou d'un groupe de personnes qui résident ensemble dans un logement ou qui occupent un logement. Le recensement est l'enquête permettant de recueillir les données les plus complètes sur les codes postaux des ménages pour le Canada. Le code postal fourni par le répondant dans le cadre du recensement et le code postal attribué au logement de la personne par la SCP sont généralement les mêmes. Ces données peuvent servir à déterminer la région géographique normalisée liée au code postal déclaré dans le cadre du recensement. Le diagramme ciaprès montre comment ces éléments sont liés. Dans le cadre du recensement, on demande aux répondants de fournir le code postal de leur résidence. Étant donné que ces renseignements sont disponibles au niveau du ménage et au niveau de l'îlot de diffusion, pourquoi ne pas simplement attribuer des codes postaux aux îlots de diffusion (et autres régions géographiques normalisées), sur la base du recensement seulement? Les régions géographiques normalisées servent généralement de base à l'analyse, et toute extraction de données à partir du code postal peut être effectuée à partir de ces régions géographiques normalisées. Toutefois, si les régions géographiques normalisées doivent être utilisées comme moyen pour coupler de façon fiable les codes postaux et d'autres données, les données du recensement doivent être complétées par le géocodage pour les raisons suivantes :
Les codes postaux déclarés dans le cadre du recensement peuvent servir à mettre en correspondance les secteurs de service, tant pour le code postal que pour la RTA. Ainsi, on peut obtenir des données de meilleure qualité en combinant les données du recensement et celles disponibles auprès de la SCP. 2.2 Identification du secteur de recherche pour le géocodageÉtant donné que moins de 40 % des noms uniques de collectivités de la SCP correspondent à une SDR, comment pouvonsnous géocoder les adresses comprenant les 60 % qui restent de noms de collectivités de la SCP? On peut localiser les noms de rue et les adresses pour le géocodage à partir des données du recensement. Un essai a été mené à l'automne 2005, afin de mesurer le taux de géocodage fondé sur les secteurs de service de RTA. Étant donné que les RTA sont plus stables que les codes postaux au fil du temps, des secteurs de recherche ont été créés à partir des RTA des codes postaux valides déclarés dans le Recensement de 2001. Pour l'essai de géocodage des codes postaux de juin 2005, des secteurs de service de RTA ont été créés à partir des codes postaux valides en mai 2001. Des îlots de diffusion ont été attribués à une RTA uniquement si un code postal valide comportant cette RTA était déclaré au moins quatre fois dans cet îlot de diffusion15. Le géocodage des codes postaux a été effectué à l'intérieur du secteur de service de la RTA pour la RTA de ce code postal. Essentiellement, les secteurs de service de RTA ont servi de secteurs de recherche pour le géocodage. En dépit de ces critères conservateurs, plus de 88 % des enregistrements comportant une adresse municipale (de CPTypes 1 et 2) ont pu être géocodés, la plupart, au niveau le plus détaillé du côté d'îlot. L'utilisation de ces secteurs de recherche semble être une façon productive d'effectuer le géocodage, lorsque le secteur de service du code postal est désigné au moyen d'adresses municipales (CPTypes 1 et 2) et que les adresses municipales et les données du réseau routier connexes sont disponibles dans le Fichier du réseau routier. Une méthode est nécessaire pour le géocodage des codes postaux qui ne sont pas liés à des adresses municipales (CPTypes 3, 4 ou 5) ou dont les adresses municipales ne se trouvent pas dans le Fichier du réseau routier. Estce que le recensement fournit des renseignements suffisants pour les géocoder? Les données sur le code postal déclarées dans le cadre du Recensement de 2001 peuvent être examinées, afin de déterminer les types de codes postaux qui ont été utilisés. Ces réponses devraient être évaluées avec précaution, certains codes postaux comportant plusieurs types d'enregistrements, et les répondants n'indiquant pas le type d'enregistrement de leur code postal. Les codes postaux sont par conséquent examinés ciaprès dans le contexte des combinaisons de types d'enregistrements. Le Fichier Recherche d'adresses de juin 2001 comportait 758 658 codes postaux qui n'ont pas été retirés. Parmi les 673 242 codes postaux valides déclarés dans le cadre du recensement, 673 179 ont été trouvés dans le Fichier Recherche d'adresses de juin 2001. Un examen détaillé des codes postaux qui n'ont pas été déclarés a révélé ce qui suit. Il semble que presque tous les codes postaux de livraison rurale sont déclarés. Seulement 19 codes postaux de livraison rurale n'ont pas été déclarés du tout. Cela représente moins de 1 % de tous les codes postaux ruraux. Étant donné que le codage des enregistrements de CPTypes 4 et 5 est particulièrement difficile, l'utilisation des réponses du recensement semble être une approche efficace pour géocoder ces codes dans les régions rurales. Une comparaison des résultats déclarés du Recensement de 2001 et de ceux du Recensement de 2006 devrait nous permettre de déterminer si ces codes postaux sont stables au fil du temps et si, par conséquent, les données du recensement sont suffisantes pour géocoder les codes postaux actifs au moment du recensement. Un moins grand nombre de codes postaux de livraison urbaine ont été déclarés (en comparaison avec la livraison rurale). Les codes postaux des entreprises ne sont pas déclarés dans le recensement pour des raisons évidentes. Cela semble être le cas pour environ 50 % des codes postaux de CPType 3. Les codes postaux de CPType 5 ne sont peutêtre pas utilisés autant dans les secteurs de livraison urbaine, étant donné particulièrement que la plupart des personnes se font livrer le courrier directement à leur résidence. Même si seulement 10 % des codes postaux de type 1 n'ont pas été déclarés, leur nombre est quand même important (76 581). Ces codes postaux ne sont pas considérés comme des codes postaux d'entreprises selon le type d'enregistrement. Toutefois, après un examen plus approfondi, il semble s'agir de codes postaux liés à des immeubles non résidentiels. Par exemple, K2E 7L6, K2E 7J5 et K2E 1B6 sont associés à des adresses municipales le long de la promenade Colonnade à Ottawa. Celleci est zonée comme une « zone industrielle générale »16. Les sousensembles des codes postaux de CPType 1 qui n'ont pas été déclarés ont été classés par la suite du point de vue de leur TML, puis vérifiés, afin de déterminer s'ils correspondaient à une livraison à une adresse unique. La ventilation des codes postaux de CPType 1 qui n'ont pas été déclarés figure ciaprès. Ensemble, un peu plus de la moitié de ces codes postaux correspondent à une livraison à une adresse unique17. Étant donné que plus de la moitié de ces codes postaux sont liés à une adresse unique, et certains d'entre eux sont clairement désignés comme des adresses commerciales par la SCP, cela laisse supposer que les codes postaux urbains de CPType 1 pourraient en fait être principalement des codes postaux d'entreprises ou d'établissements. L'utilisation du code postal déclaré dans le recensement constitue probablement un outil approprié pour déterminer les secteurs de service de RTA, tout comme celle des codes postaux liés à des ménages (plutôt qu'à des entreprises ou des établissements). Généralement, les codes postaux de ménages sont déclarés dans le recensement et les secteurs de service créés à partir de la RTA déclarée devraient être suffisants pour le géocodage de la majorité des codes postaux18. 2.4 Recommandations pour le géocodage fondé sur les réponses du recensementLes données du recensement constituent une bonne source de géocodage, dans les cas où les codes postaux sont utilisés au moment du recensement. Elles peuvent aussi servir à créer les secteurs de recherchepour le géocodage des codes postaux d'adresses municipales. Ces données de base peuvent aider à attribuer les codes postaux aux îlots de diffusion, aires de diffusion et SDR. L'utilisation du code postal peut changer au fil du temps parce que la Société canadienne des postes modifie les codes postaux et que les utilisateurs peuvent modifier leurs codes postaux déclarés. Par ailleurs, il n'est pas possible d'obtenir un code postal pour chaque ménage dans le cadre du recensement, parce que les réponses sont parfois illisibles, invalides ou laissées en blanc. Toutefois, le code postal figurant dans le recensement, particulièrement s'il est fréquemment déclaré à l'intérieur d'un îlot de diffusion, peut être utilisé efficacement pour définir la RTA du code postal utilisé selon l'îlot. Même si les codes postaux ont tendance à changer un peu chaque mois, le secteur de service de la RTA sera probablement plus stable sur la période de cinq ans séparant les recensements19. La possibilité de géocoder les données de la Société canadienne des postes pour 2005 à partir des secteurs de service créés sur la base des données du Recensement de 2001 laisse supposer que les RTA sont en fait habituellement stables. La stabilité des secteurs de service de RTA, ainsi que du rapport entre les codes postaux déclarés et les régions géographiques normalisées, devraient aussi faire l'objet d'une vérification plus rigoureuse, grâce à la comparaison des résultats du Recensement de 2001 et de ceux du Recensement de 2006. Les codes postaux déclarés dans le Recensement de 2006 peuvent être utilisés de la façon suivante pour le géocodage.
Le géocodage directement en fonction des régions géographiques normalisées à partir des données du recensement, plutôt que par suite de la conversion des données géocodées précédemment, devrait être conforme au concept de secteurs de service de code postal et devrait permettre une couverture plus complète et une précision plus grande. 3.0 Règles de géocodage et mesures de la qualitéOn peut procéder au géocodage sur la base de règles, en combinant les données du recensement et les fichiers de la SCP. Des indicateurs de qualité peuvent être élaborés pour chaque enregistrement géocodé au moyen de cette méthode, la méthode de géocodage fondée sur des règles et les données utilisées pour le géocodage pouvant servir à créer les indicateurs de qualité. 3.1 Secteurs de service et secteurs de rechercheLes secteurs de service doivent être précisés pour que le processus de géocodage puisse être entrepris. Les secteurs de service et les rapports proposés pour le géocodage sont les suivants :
Comme il est indiqué précédemment, le secteur de service de la RTA peut servir à la recherche et au géocodage en fonction des tranches d'adresses municipales. Dans le cas du Recensement de 2006, chaque secteur de service de la RTA engloberait toutes les AD qui comprennent au moins un îlot de diffusion où un nombre minimum de répondants ont déclaré cette RTA dans le cadre du recensement20. Le fait de compter un nombre minimum de répondants permet de s'assurer que la RTA est véritablement utilisée et déclarée de façon précise à l'intérieur de l'AD. Étant donné que plus d'une RTA peut être utilisée à l'intérieur d'une AD, les limites de RTA élaborées pour des AD globales se chevaucheront. Toutefois, un léger chevauchement et un surdénombrement ne devraient pas poser de problème, étant donné que ces secteurs de service de RTA ne seront pas utilisés directement pour procéder au géocodage. Les secteurs de service de RTA fourniront uniquement les secteurs de recherche pour la recherche et le géocodage des codes postaux, sur la base des données sur les adresses municipales figurant dans les fichiers du réseau routier. Le secteur de service du code postal, contrairement au secteur de service de la RTA, sera élaboré de façon plus rigide, afin d'inclure uniquement les îlots de diffusion où ce code postal a été déclaré par un nombre minimum de répondants. Par ailleurs, afin de limiter les chevauchements, seuls les codes postaux les plus souvent déclarés dans cet îlot de diffusion seront retenus. Des critères plus rigides de délimitation sont utilisés parce que le secteur de service du code postal peut servir à géocoder directement le code postal en fonction d'un îlot de diffusion où ce code postal est utilisé. Toutefois, on ne peut pas attribuer un secteur de recherche à tous les codes postaux sur la base des données fournies dans le Recensement de 200621. Des codes postaux imputés pourraient être utilisés pour créer des secteurs de recherche plus exhaustifs, mais cette façon de faire est généralement un peu moins fiable. Il existe une autre possibilité, à savoir créer le lien entre la SDR utilisée pour le recensement et les anciens noms de la SDR, ainsi que le fichier de noms de lieux de la Division de la géographie. La couverture de la collectivité de la SCP montre le secteur où le nom de rue est unique. (Comme il est indiqué précédemment, la SCP conserve les anciens noms de municipalités dans les cas de fusions et de modification des limites, tant que les problèmes liés aux adresses municipales en double ne sont pas résolus.) Il est difficile de définir de façon définitive les limites des collectivités de la SCP, parce que ces limites ne sont pas disponibles auprès de la SCP. Toutefois, les SDR peuvent être appariées à une collectivité de la SCP22. Cet appariement entre le nom de la SDR et la collectivité de la SCP peut servir à confirmer le géocodage automatisé selon le secteur de service de la RTA. Toutefois, étant donné que la correspondance est floue du point de vue du secteur couvert, elle ne servira pas de méthode principale pour créer les secteurs de recherche pour le géocodage automatisé. La correspondance de la collectivité de la SCP et de la SDR servira uniquement comme outil de vérification additionnelle du géocodage automatisé et comme méthode secondaire de géocodage. 3.2 Géocodage des codes postaux selon le CPTypeÉtant donné que le but visé est de géocoder les codes postaux de la façon la plus définitive possible, la priorité sera accordée au géocodage des enregistrements de codes postaux dont les secteurs de service sont définis selon des tranches d'adresses municipales. Il s'agit des codes de CPTypes 1 et 2. La couverture la plus définitive suivante est probablement celle du CPType 4, étant donné que les itinéraires desservis sont définis, même s'ils ne comportent pas d'adresses municipales ou de noms de rue qui peuvent être appariés à un Fichier du réseau routier. Enfin, les CPTypes 3 et 5, qui sont liés à une installation de livraison postale, mais qui peuvent être utilisés par les ménages de divers secteurs de la collectivité de la SCP ou même par des voyageurs ou d'autres personnes à l'extérieur de la municipalité, auront la priorité en ce qui a trait à l'affectation des régions géographiques normalisées au code postal. Cette affectation des régions géographiques normalisées dans le contexte du type de service disponible à l'endroit en question met l'accent sur le code postal le plus susceptible d'être utilisé dans cette région géographique normalisée. Les codes postaux de CPTypes 1 et 2 peuvent définitivement être géocodés grâce à l'appariement des données sur les adresses de la SCP et de celles du Fichier du réseau routier. Si l'appariement repose uniquement sur les données du réseau routier et celles sur les adresses, on pourra obtenir des appariements multiples (dans l'ensemble du Canada). Par exemple, il existe de nombreuses rues « Principale » au Canada. La recherche du nom de rue « Principale » donnera lieu à des appariements multiples. Dans le programme d'appariement automatisé, les appariements seront effectués à l'intérieur d'un secteur de recherche. Les essais effectués jusqu'à maintenant laissent supposer que le secteur de recherche de la RTA peut être utilisé Diverses combinaisons de CPTypes 2, 3, 4 et 5 sont obtenues en parallèle, particulièrement dans les secteurs de livraison rurale (voir le tableau 5). Les codes postaux déclarés dans le recensement ne comprennent pas de renseignements sur le type d'enregistrement. Par conséquent, le CPType de service lié au code postal ne peut être déduit. Le Fichier Recherche d'adresses de la SCP comprend des données sur l'adresse municipale pour les codes de CPType 2, mais la couverture de chacun des autres CPTypes, pour un code postal donné, ne peut être déduite. Compte tenu de cela, le géocodage d'une partie d'un type particulier de code postal de CPType 3, 4 ou 5 peut ne pas être précis du point de vue de l'utilisation. Par le passé, les codes postaux liés à des installations de CPType 3 principalement devaient être codés (dans le FCCP) selon l'îlot de l'installation. L'approche dans ce cas consiste à poursuivre ce codage, tout en désignant l'enregistrement du FCCP comme se rapportant à l'installation. Toutefois, lorsque la poste restante (CPType 5) et la case postale (CPType 3) sont les seuls services disponibles, ils peuvent aussi être géocodés selon la région géographique normalisée, du fait qu'il s'agit du code postal le plus couramment utilisé dans ce cas. L'approche qui suit est proposée pour les codes postaux comportant toute permutation d'enregistrements de CPTypes 2, 3, 4 et 5.
Dans les AD peu peuplées, où le service postal utilisé n'est pas évident à partir des réponses fournies ou des données sur les adresses, ce service est probablement assuré à partir de l'installation postale la plus proche. Ces AD pourraient être codées selon le code postal de l'installation de livraison la plus proche où le service postal est accessible (type 5 ou 3). Le géocodage effectué de cette façon pourrait être signalé à l'aide d'un champ indiquant la source de géocodage. Le but visé est d'assurer le géocodage complet des codes postaux dans le contexte du service disponible dans chaque AD habitée. La méthode de géocodage décrite ici repose sur le secteur de service de la RTA, le recensement servant de secteur de recherche principal. Les enregistrements de CPTypes 1 et 2 sont par la suite géocodés à l'intérieur de ce secteur, grâce à un appariement en fonction des données sur les adresses municipales. Lorsque cela n'est pas possible, le rapport entre la collectivité de la SCP et la RTA à la SDR pourra être utilisé. Le géocodage des enregistrements de CPTypes 3, 4 et 5 est plus complexe, étant donné que ceuxci ne correspondent pas à des adresses municipales. Toutefois, les réponses du recensement peuvent être utilisées pour effectuer le codage dans les secteurs où ces codes postaux sont utilisés. Les enregistrements de CPTypes 3 et 5 continueront aussi d'être codés selon l'installation postale, ainsi que le secteur de service. Ainsi, tous les codes postaux utilisés peuvent être mis en correspondance avec des régions géographiques, sur la base des données du recensement disponibles et du Fichier du réseau routier. 3.3 Mesures de la qualitéLa qualité du géocodage des codes postaux peut être améliorée et faire l'objet de meilleurs rapports, compte tenu du concept de géocodage selon la RTA et les secteurs de service de code postal. (Le contexte et les définitions des mesures de la qualité figurent à l'annexe B.) A. Actualité L'actualité peut être mesurée du point de vue de la différence entre les éléments suivants :
L'examen conceptuel dont il est question précédemment prévoit le géocodage fondé sur des règles pour les codes postaux, selon les côtés d'îlot de diffusion, les îlots de diffusion et les AD du cadre géographique de Statistique Canada. Le géocodage automatisé a été mis à l'essai et peut améliorer l'efficacité du processus. Même s'il n'est pas possible d'utiliser le géocodage automatisé lorsque les données sont insuffisantes dans le cadre géographique ou qu'il existe des incohérences entre le cadre géographique et les données de la SCP, il peut servir pour la majorité des enregistrements. Cette efficacité peut entraîner les améliorations suivantes:
Il existe des différences de dates de référence entre les données du recensement (disponibles une fois tous les cinq ans), les fichiers de la Société canadienne des postes (disponibles une fois par mois) et les fichiers du réseau routier, qui sont périodiquement mis à jour. Cela peut entraîner des difficultés dans la création de l'association ou du lien dans le cadre du processus de géocodage. Lorsqu'il manque des données à jour dans les fichiers du réseau routier, on résout habituellement la question en communiquant avec la municipalité appropriée et en obtenant l'information. Il peut s'agir d'un processus long, qui peut imposer un fardeau à la municipalité. Une façon de résoudre ce problème consisterait à échelonner le géocodage, c'estàdire que l'on coderait en fonction de la SDR ou de l'AD uniquement en l'absence de données dans le Fichier du réseau routier, et que l'on coderait selon des niveaux plus précis, au fur et à mesure que les renseignements deviennent disponibles. À l'heure actuelle, une fois qu'un code postal est géocodé, nous ne le récupérons jamais pour tenter d'en améliorer la précision. En fait, il se peut qu'un code postal ne soit jamais géocodé à nouveau, à moins que la Société canadienne des postes n'indique un changement de service pour ce code postal. Grâce au géocodage automatisé, nous pourrions envisager des améliorations de la précision avec chaque version du Fichier du réseau routier. B. Exactitude et précision L'exactitude du processus de géocodage se mesure par le degré de conformité du géocodage selon la ou les régions géographiques normalisées appropriées. La précision peut être mesurée en fonction de la correspondance entre le nombre de côtés d'îlot et d'îlots de diffusion codés et les tranches d'adresses desservies par le code postal. Une cote de qualité au niveau de l'enregistrement peut être créée, sur la base du processus de géocodage, afin d'indiquer le niveau de confiance de ce dernier. L'accès à plus d'une source d'information pour le géocodage permet en outre l'élaboration d'indicateurs de qualité. Il existe une façon d'attribuer l'indicateur de qualité, à savoir élaborer un indicateur à trois caractères fondé sur le processus de géocodage proprement dit. Les caractères devraient être facilement compréhensibles, « AAA » laissant supposer que la qualité du géocodage a été confirmée par plus d'une source et a été jugée la meilleure, et « CCC » indiquant que le géocodage constitue une approximation. Le tableau suivant illustre le concept proposé. Indicateurs de qualité pour les enregistrements de CPTypes 1 et 2 L'indicateur de qualité (IQ) final est élaboré sous forme de concaténation, par exemple : IQ = IQ_1 ¦ IQ_2 ¦ IQ_3 Un IQ = AAA correspond au meilleur géocodage possible. Indicateur de qualité (IQ_1) Indicateur de qualité (IQ_2) Indicateur de qualité (IQ_3) Cet indicateur de qualité s'applique au processus d'appariement des adresses municipales pour les CPTypes 1 et 2 (environ 97 % des enregistrements du Fichier Recherche d'adresses). Un indicateur de la qualité des données pourrait aussi être fourni de façon similaire pour les codes postaux codés directement selon une installation. Lorsque le géocodage est effectué sur la base des données du recensement seulement, une mesure de stabilité pourrait être créée, à partir de la comparaison de la région géographique déclarée dans le recensement précédent. Cette validation ne constitue pas une mesure directe de l'exactitude, mais fournit une indication du degré de confiance du géocodage. Indicateurs de qualité pour les enregistrements de CPTypes 3, 4 et 5 L'indicateur de qualité (IQ) final est élaboré sous forme de concaténation, par exemple : IQ = IQ_1 ¦ IQ_2 Un IQ = AA correspond au meilleur géocodage possible. Il n'y a pas de IQ_3 disponible pour les CPType 3, 4 et 5, étant donné qu'il n'existe pas de données sur les tranches d'adresses municipales décrivant le secteur de service, et que le géocodage n'est pas effectué selon la même précision. Indicateur de qualité (IQ_1) A : Secteur de recherche fondé sur le secteur de service de la RTA et la correspondance entre la collectivité de la SCP et la SDR Indicateur de qualité (IQ_2) CPTypes 3, 4, 5 (emplacement du secteur de service du code postal) A : Secteur stable (c.àd. géocodé selon la même ) sur la base des données du recensement courant et du recensement précédent CPType 3 (emplacement de l'installation) A : Adresse du Fichier sur les chefs de ménage géocodée selon le Fichier du réseau routier et appariement avec l'AD du fichier des emplacements de la SCP23 La précision du secteur codé peut être mesurée dans le contexte du niveau géographique servant au codage, ainsi que du nombre de régions géographiques normalisées codées. Cela est particulièrement pertinent pour le géocodage fondé sur les adresses municipales. Par exemple, les secteurs de service des enregistrements de CPTypes 1 et 2 sont définis selon les tranches d'adresses. Cela signifie qu'au niveau le plus précis, le géocodage sera effectué selon le côté d'îlot, suivi par l‘îlot de diffusion et par l'AD, cette dernière constituant le niveau le moins précis de géocodage. Le nombre d'îlots de diffusion servant au géocodage en proportion du nombre de tranches d'adresses pour un code postal permettra aussi d'indiquer s'il y a eu affectation d'îlots de diffusion inutiles à un code postal. Des mesures de la précision peuvent être utilisées dans le cadre de la vérification du processus de géocodage, ainsi que pour fournir des indicateurs généraux aux utilisateurs des données. C. Intégralité Étant donné que les produits fondés sur les codes postaux (FCCP et FCPCEF) fournissent des liens entre les codes postaux et les régions géographiques normalisées, l'intégralité de la couverture de ces produits peut être mesurée de la façon suivante:
Le changement de méthodologie proposé ici permet de coder les codes postaux de CPTypes 3 et 5 en fonction des AD habitées, lorsqu'aucun itinéraire de facteur ou service d'itinéraire n'est disponible. Cela donnera lieu à une couverture plus complète du service postal offert au Canada. D. Pertinence Les ventes ainsi que l'utilisation des FCCP et des FCPCEF à Statistique Canada montrent que ce produit est utile. Toutefois, un indicateur du fichier, l'indicateur de lieu unique (ILU), sert à la répartition de la population ou des logements, même s'il n'est pas véritablement destiné à cette fin. L'ILU est conçu pour fournir un point représentatif pour un code postal, aux fins de la mise en correspondance des points d'identification du code postal. Toutefois, cet indicateur est aussi utilisé pour l'affectation des données. Il se peut qu'une région géographique normalisée (îlot de diffusion ou AD) ne soit pas représentative de toute la population ayant accès à ce code postal. Par exemple, un secteur de service de code postal peut englober trois îlots de diffusion, et il se peut qu'un îlot de diffusion ne soit pas plus représentatif que les autres. Il est recommandé que la répartition des données se fasse au moyen du logiciel statistique offert par Statistique Canada (FCCP+) ou d'un autre processus de répartition fondé sur un fichier pondéré de la population des AD24. E. Intelligibilité et métadonnées Des métadonnées peuvent être fournies au niveau de l'enregistrement, afin de permettre aux clients de mieux comprendre le couplage des enregistrements. Ces métadonnées contribueront aussi à l'évaluation interne des améliorations qui pourraient être nécessaires dans le géocodage. L'indicateur de qualité (IQ) a été abordé précédemment (dans la section 3.3). Les autres métadonnées proposées au niveau de l'enregistrement sont décrites ciaprès. Méthode de codage La méthode de codage peut être pertinente selon la qualité du couplage des enregistrements. On propose ce qui suit pour cet indicateur :
À l'heure actuelle, il est proposé de produire un IQ uniquement pour les enregistrements géocodés de façon automatique. Cet indicateur supplémentaire documente la source des autres types de couplages d'enregistrements. Grâce au contrôle de la qualité de ces autres types de codages, l'IQ pourrait inclure toutes les sources de codage à l'avenir. Secteurs de service codés Le code postal peut être codé en fonction du secteur de service du code postal ou d'une installation de livraison, et ces deux types de codage doivent être distingués. On propose ce qui suit pour cet indicateur :
TML avec modifications À l'heure actuelle, lorsque le TML est absent, Statistique Canada attribue un « W ». Ce « W » comprend à la fois les régions rurales et les petites régions urbaines. L'utilisateur peut être en mesure de mieux utiliser le TML si une distinction est faite entre elles. Une autre lettre, comme « S », pourrait être utilisée pour faire une distinction pour les régions de livraison rurale, lorsqu'un enregistrement est de CPType 2 et que la livraison à une adresse municipale est disponible. Les règles de géocodage et des sources bien définies pour le géocodage permettent la création d'indicateurs de qualité et d'autres métadonnées qui peuvent renseigner l'utilisateur, ainsi que permettre le contrôle de la qualité des fichiers. ConclusionLe présent document visait à : 1) étudier les concepts et descripteurs de codes postaux utilisés par la Société canadienne des postes; 2) établir un cadre conceptuel définissant le rapport entre les codes postaux et les régions géographiques normalisées; et 3) définir par la suite des règles opérationnelles pour le couplage des codes postaux et des régions géographiques normalisées. Les codes postaux peuvent être liés à des régions géographiques normalisées grâce aux secteurs de service de code postal. Même si, dans certains cas, les données sur les adresses disponibles auprès de la Société canadienne des postes sont suffisantes pour géocoder le code postal en fonction du Fichier du réseau routier, des renseignements supplémentaires sont nécessaires dans nombre de cas pour procéder au géocodage. Le recensement fournit un moyen idéal pour faire une distinction entre le secteur de service de la RTA et celui du code postal. Même si cette méthode de géocodage met l'accent sur l'utilisation des codes postaux par les ménages, des codes postaux d'entreprises peuvent aussi être géocodés de cette façon25. Pour le géocodage du code postal, la première étape consisterait à déterminer le secteur de service de la RTA, sur la base du recensement, et à la compléter par un fichier de concordance de la collectivité de la SCP et de la SDR. Cela permettrait d'établir le secteur de recherche à l'intérieur duquel le code postal peut être géocodé. La différenciation des empreintes géographiques des codes postaux selon le type permet un meilleur codage selon les secteurs deservice de code postal. Un processus de géocodage automatisé fondé sur cette méthode permettra d'assurer l'efficacité du géocodage. Un système efficace de géocodage peut être utilisé au besoin pour profiter des mises à jour des codes postaux, ainsi que des améliorations du réseau routier. En dernier ressort, le cadre conceptuel abordé ici fournit les règles pour un processus de géocodage efficace, y compris des métadonnées sur la qualité de l'enregistrement géocodé. Notes1. Les termes en italique sont définis dans le glossaire. 2. La classification de la SCP est considérée comme une composante de la préparation du courrier. La classification est fondée sur le deuxième caractère du code postal, de la façon suivante :
3. Dans le présent document de travail, le terme « recensement » désigne le Recensement de la population. 4. Statistique Canada définit les régions urbaines et rurales, d'après le Recensement de la population, pour les îlots de diffusion, de la façon suivante : Une région urbaine compte au minimum 1 000 habitants et a une densité de population d'au moins 400 personnes par kilomètre carré, selon les chiffres du recensement courant de la population. L'ensemble du territoire situé à l'extérieur des régions urbaines est classé comme rural. Ensemble, les régions urbaines et rurales couvrent tout le territoire canadien. 5. Les autres 3 % de codes postaux ne sont pas liés à des adresses municipales, mais à des cases postales de bureaux de poste et à des itinéraires de service postal. 6. Ce taux d'appariement est fondé sur l'appariement de noms uniques de SDR à l'intérieur d'une province/territoire et des noms de collectivités de la SCP correspondant aux codes postaux d'une province/territoire (selon la première lettre du code postal). L'appariement a été effectué après uniformisation des noms en lettres majuscules, sans accent ni caractère spécial. Les chiffres du tableau constituent en fait une légère surestimation du taux d'appariement, étant donné que le type de SDR n'a pu être pris en compte dans l'appariement et ne figure pas dans le dénominateur servant au calcul du pourcentage. (Les SDR comportant le même nom, mais un type différent [ville, réserve, district municipal, etc.], comme la ville de Yarmouth et le district municipal de Yarmouth, les deux se trouvant en NouvelleÉcosse, sont des SDR entièrement différentes. Voir le Glossaire pour une définition du type de SDR.) 7. Il est essentiel de trouver le secteur de service propre à un code postal pour établir un processus de géocodage automatisé. Toutefois, dans le cadre d'un processus de géocodage manuel, il existe des options de recherche de diverses cartes, et même de consultation des municipalités. 8. Ces renseignements sont fondés sur une analyse des données sur les codes postaux tirées de divers documents de la Société canadienne des postes dans le site Internet de la SCP : http://www.postescanada.ca/ et obtenues dans le cadre d'une conversation téléphonique avec un représentant de la Société canadienne des postes, le 17 novembre 2004. 9. Cette liste typologique constitue un regroupement des données fournies pour les enregistrements décrits dans le Fichier technique des données sur les adresses et les codes postaux (Société canadienne des postes, 2005c, pages 6 à 11). 10. Les données du Fichier Recherche d'adresses peuvent servir à trouver l'installation de livraison dans le Fichier sur les chefs de ménage. L'adresse municipale de l'installation de livraison est souvent (mais pas toujours) disponible dans le Fichier sur les chefs de ménage. Les emplacements des installations de livraison sont aussi disponibles auprès de la Société canadienne des postes. 11. Ce code postal, qui comporte des enregistrements de CPTypes 1 et 3 se retrouve dans la version de décembre 2004 du Fichier Recherche d'adresses de la Société canadienne des postes. Il a aussi été confirmé dans l'outil de recherche sur Internet consulté le 30 mai 2005, à l'adresse http://www.postescanada.ca/. 12. Ces renseignements sont fondés sur une conversation téléphonique avec un représentant de la Société canadienne des postes, le 17 novembre 2004. 13. Le TML ne doit pas être confondu avec le CPType du FCCP. Le TML a davantage à voir avec la façon dont le courrier est livré. Le type d'enregistrement du code postal a préséance du point de vue de l'endroit où le courrier est livré. Un cas type est celui d'un gros destinataire de courrier dont le code postal comporte des enregistrements de CPTypes 3 et 1. Un envoi dont l'adresse est formatée comme un enregistrement de CPType 1 (adresse municipale) continuera d'être envoyé à la case postale correspondant au code postal, à condition que le code postal soit exact et qu'il puisse être lu à la machine. (Autrement, la machine tentera de déchiffrer le code postal sur la base des données de l'adresse.) Ce système empêche la livraison de quantités importantes de courrier par un facteur. Le TML est utilisé par les gros envoyeurs de courrier pour obtenir des remises, par suite du tri préliminaire du courrier. (Ces données sont fondées sur une conversation avec un représentant de la SCP, le 27 novembre 2004.) 14. La grande majorité des enregistrements du Fichier Recherche d'adresses sont de CPTypes 1 et 2 et ont trait à la livraison à un logement ou un immeuble particulier. Les autres types d'enregistrements ont trait aux services disponibles à partir de l'installation de livraison. 15. Lorsque les codes postaux d'une autre province ont été déclarés à l'intérieur de l'îlot de diffusion, cela n'a pas été pris en compte dans le géocodage. La méthode de géocodage est expliquée de façon plus détaillée dans la section suivante. 16. À partir des cartes et des données du site Web de la ville d'Ottawa (Ottawa.ca), consulté le 5 juillet 2006. 17. Cela comprend tous les codes postaux du graphique précédent dont les TML sont E, B et G, ainsi que les codes postaux dont le TML est A et qui correspondent à une livraison à une adresse uniquement seulement. 18. La méthode utilisée pour le géocodage des codes postaux en fonction des régions géographiques du Recensement de 2001 est fondée sur l'appariement du nom de collectivité de la SCP et du nom de SDR. Cette méthode pose des problèmes, comme il est indiqué dans la section 1.3. Toutefois, des améliorations sont apportées à l'appariement des noms de SDR et sont abordées plus loin dans l'annexe C. 19. Lorsque des changements à grande échelle touchent à l'occasion les secteurs de RTA, ils sont signalés par la SCP. 20. Pour la vérification des secteurs de service de RTA (mentionnée dans la section 2.2), un îlot de diffusion du Recensement de 2001 est attribué à un secteur de service uniquement si un minimum de quatre répondants ont déclaré des codes postaux comportant cette RTA dans cet îlot. Le choix d'un nombre minimum de réponses pour une RTA est fondé sur l'hypothèse que la probabilité est plus faible que quatre personnes fassent la même erreur en déclarant la RTA dans le même îlot que celle d'une personne de faire l'erreur dans le même îlot. Malgré l'utilisation de ce critère conservateur, le taux de géocodage a été supérieur à 88 % pour les enregistrements d'adresses municipales de CPTypes 1 et 2. 21. D'après la vérification des secteurs de service de la RTA mentionnée précédemment, les secteurs de service n'ont pu être élaborés pour tous les codes postaux, ces derniers n'ayant pas tous été utilisés. 22. Une liste de correspondance entre les noms de collectivités de la SCP et les SDR a été créée pour la recherche d'adresses municipales dans le cadre du processus de géocodage manuel. Voir l'annexe C pour plus de détails sur les améliorations apportées à ce fichier de correspondance. 23. Un fichier d'emplacement de l'installation de livraison a été obtenu de la SCP en janvier 2006. 24. Le logiciel Fichier de conversion des codes postaux Plus (FCCP+) est un produit complémentaire du Fichier de conversion des codes postaux (FCCP). Il s'agit d'un système automatisé qui utilise les codes postaux pour attribuer les régions géographiques du recensement. FCCP+ est fondé sur le Fichier de conversion des codes postaux le plus récent et sur le Fichier de la pondération de la population par codes postaux produit par la Division de la géographie de Statistique Canada. FCCP+ utilise des poids pour affecter les codes postaux liés à des aires de diffusion multiples, selon la répartition de la population en fonction d'un code postal donné. 25. Les auteurs suggèrent que l'utilisation des codes postaux par les entreprises, ainsi que les comparaisons de l'empreinte du secteur de service du code postal pour le Recensement de 2001 et de celle du Recensement de 2006, soient explorées dans un document de travail subséquent. |
|