Rapports sur la santé
Précision de l’appariement des codes postaux résidentiels aux régions géographiques du recensement

par Lauren Pinault, Saeeda Khan et Michael Tjepkema

Date de diffusion : le 17 juin 2020

DOI : https://www.doi.org/10.25318/82-003-x202000300001-fra

Dans la majorité des ensembles de données administratives ou d’enquête sur la santé au Canada, les renseignements géographiques dont les chercheurs disposent se limitent à un code postal résidentiel plutôt qu’à une adresse municipale complète, souvent pour des raisons de confidentialité. Les codes postaux sont des codes alphanumériques à six caractères créés par la Société canadienne des postes aux fins du tri et de la distribution du courrierNote 1. Étant donné que les codes postaux ne se rapportent pas toujours à des unités spatiales bien définies, distinctes et homogènes, leur utilisation pour assigner des attributs géographiques comme l’exposition à des risques environnementaux présente une certaine incertitude. Les codes postaux ne correspondent pas toujours aux régions géographiques du recensement, car de nombreux codes postaux traversent les limites géographiques du recensementNote 2. Les codes postaux peuvent donc être appariés à une ou à plusieurs unités géographiques du recensement.

Les codes postaux sont utilisés dans un large éventail de disciplines de recherche en santé pour attribuer des covariables contextuelles aux sujets. Des estimations de la défavorisation socioéconomique et d’autres variables démographiques propres aux quartiers ont été utilisées pour prédire les problèmes de comportement chez les enfantsNote 3 et les taux de dépression élevés dans les régions urbainesNote 4. L’Agence de la santé publique du Canada a créé des indicateurs fondés sur les régions pour rendre compte de l’état de santé et des déterminants de la santé afin de faire ressortir les inégalités régionales en matière de santé au CanadaNote 5. En l’absence de données socioéconomiques à l’échelle de la personne dans un ensemble de données sur la santé, des chercheurs ont également utilisé des estimations fondées sur les régions pour calculer par approximation le revenu personnel afin de tenir compte des variables confusionnelles d’un modèle. À titre d’exemple, le revenu du quartier a été utilisé pour corriger des modèles de la prévalence du diabète chez les immigrants en OntarioNote 6, dans une étude menée auprès de patients atteints de l’arthrite rhumatoïde ayant reçu des services spécialisésNote 7 et dans une étude menée auprès de personnes ayant cherché à obtenir des soins contre le VIH/sida en Colombie-BritanniqueNote 8. Les codes postaux ont été utilisés parallèlement à des enregistrements d’adresse municipale incohérents dans un ensemble de données provenant de coroners pour améliorer la géolocalisation des sites de surdoses de drogue, permettant ainsi aux chercheurs d’évaluer l’efficacité d’un site d’injection supervisé à VancouverNote 9.

Dans les recherches sur l’hygiène de l’environnement, la région géographique fondée sur le code postal est utilisée dans les systèmes d’information géographique pour relier des ensembles de données administratives et de données d’enquête sur la santé à des données environnementales provenant de diverses sources. Par exemple, aux fins d’analyse transversale, des données sur l’obésité et le diabète de l’Enquête sur la santé dans les collectivités canadiennes ont été couplées à des chiffres de population fondés sur la région et à la densité résidentielle tirés du recensement; la disponibilité des destinations ayant un potentiel piétonnier a été tirée d’ensembles de données gouvernementaux; et des indicateurs de la combinaison d’utilisations du sol, de la connectivité des rues et de la densité des restaurants à service rapide et des épiceries ont été tirés d’ensembles de données exclusifsNote 10Note 11. Dans les études longitudinales sur la mortalité, on a calculé des estimations liées à la pollution de l’air ambiant, à la verdure et à l’espace bleu (à proximité de l’eau) pour de grandes cohortes liées à la santé représentatives de la population d’après des coordonnées provenant des codes postaux déclarés dans les fichiers de données fiscalesNote 12Note 13Note 14Note 15.

Statistique Canada élabore deux produits où les codes postaux à six caractères sont appariés aux unités géographiques du recensement : 1) le Fichier de conversion des codes postaux (FCCP)Note 2, qui fournit tous les appariements possibles entre les codes postaux et les régions géographiques du recensement; 2) le Fichier de conversion des codes postaux plus (FCCP+)Note 16, dans lequel on a utilisé à la fois une pondération selon la population et une répartition aléatoire pour attribuer une région géographique précise du recensement aux personnes dans un ensemble de données. Essentiellement, dans le FCCP+, on a recours à une pondération selon la population afin de guider la sélection d’un des appariements fournis dans le FCCP pour chaque enregistrement. Une fonction secondaire du FCCP+ consiste à attribuer à chaque personne un point représentatif de latitude et de longitude; la précision de localisation de cette attribution dans tout le Canada a été évaluée dans une étude précédenteNote 17.

Bien que dans des centaines d’études sur la santé on ait utilisé le FCCP ou le FCCP+ aux fins du géocodageNote 18, la précision de l’attribution des régions géographiques du recensement d’après les codes postaux dans l’ensemble du Canada demeure peu étudiée. Dans une étude du genre menée en Nouvelle-Écosse, l’erreur de localisation dans l’attribution des régions géographiques du recensement a été estimée en comparant le FCCP+ au fichier des adresses municipales de la Nouvelle-Écosse. L’étude a permis de constater de plus faibles taux d’erreur dans les régions urbaines que dans les régions rurales, bien que certaines classifications erronées aient été observées dans toutes les régions de la provinceNote 19.

La présente étude traite des caractéristiques des codes postaux résidentiels de la population canadienne obtenues au moyen du Recensement de 2016 et permet de déterminer la mesure dans laquelle ces codes postaux sont appariés à une ou à plusieurs aires de diffusion (AD), une unité géographique du Recensement. Les AD ont été évaluées, car il s’agit de petites régions relativement stables et distinctes qui représentent environ 400 à 700 personnesNote 20. Les AD représentent la plus petite unité géographique pour laquelle les données du recensement sont diffuséesNote 20, et il s’agit de l’unité la plus fréquemment utilisée dans les recherches sur la santé pour relier des mesures relatives aux quartiers ou aux expositions environnementales aux régions géographiquesNote 3Note 6. Étant donné qu’une erreur de géocodage pourrait survenir si un code postal est apparié à plus d’une AD, le nombre d’appariements possibles aux AD a été utilisé dans le présent document comme indicateur de la précision du géocodage. Aux fins de comparaison, on a également déterminé le pourcentage de la population apparié à un secteur de recensement (SR), à une subdivision de recensement (SDR) et à une division de recensement (DR) uniques.

Méthodes

Géocodage du Fichier de conversion des codes postaux plus en fonction des aires de diffusion

Le Fichier de conversion des codes postaux (FCCP) comporte tous les appariements possibles des codes postaux aux régions géographiques du recensement (côtés d’îlot, îlots de diffusion et aires de diffusion [AD]). Le programme FCCP+ sélectionne un de ces appariements pour chaque code postal dans un ensemble de données sur la santé fourni par l’utilisateur au moyen d’un processus par étapes (figure 1). En premier lieu, les codes postaux ruraux (désignés par le deuxième chiffre « 0 ») et les codes postaux pour lesquels les types de mode de livraison (TML) indiquent une route de distribution rurale (TML = H), une livraison générale (TML = J), un service suburbain (TML = T), des cases postales (TML = K) ou des routes qui ont été retirées (TML = Z) sont appariés à un sous-ensemble du Fichier de conversion pondéré (FCP) d’après des probabilités calculées à partir de poids de population du recensement. Le FCP est un ensemble de données qui combine les codes postaux du FCCP et les chiffres de population issus du recensement à l’échelle de l’AD. Il est utilisé pour générer des poids de population pour chaque combinaison de code postal et d’AD. Bien que les codes postaux dans les régions rurales aient tendance à présenter une moins grande précision de géocodage en raison de leur plus grande étendue spatiale (c.-à-d. que les résidences pour un code postal donné sont réparties sur une plus grande région), la technique de pondération en fonction de la population permet d’apparier un ensemble de données à l’échelle de la personne aux régions géographiques du recensement de manière cohérente avec la répartition spatiale de l’ensemble de la population.

Les enregistrements du FCCP peuvent comprendre des codes postaux appariés à un seul enregistrement (unique) ou à plusieurs enregistrements (en double) de régions géographiques du recensement. Au cours de la deuxième étape, les codes postaux restants qui correspondent à des enregistrements uniques du FCCP (principalement des codes postaux urbains) sont appariés aux régions géographiques du recensement. En troisième lieu, les codes postaux restants qui sont appariés à des enregistrements en double du FCCP sont appariés aléatoirement et ont une probabilité égale à tous les enregistrements possibles du FCCP. Cependant, tous les codes postaux non appariés restants dont le TML est rural, H, J, K ou T sont signalés au cours de cette étape pour être traités en fonction des trois premiers caractères du code postal, lesquels correspondent aux régions de tri d’acheminement, au cours de la dernière étape. Pendant cette dernière étape, le FCCP+ tente d’imputer des régions géographiques du recensement en fonction de codes postaux partiels (à l’aide des cinq, quatre, trois ou deux premiers caractères de manière itérative) à l’aide de poids de population du recensement (figure 1). Les codes postaux partiels sont pris en compte lorsqu’ils sont fournis ou lorsque les codes postaux complets ne sont pas appariés aux enregistrements du FCCP.

La façon de procéder est différente du processus par étapes du FCCP+ dans le cas de l’indicateur de lien unique (ILU) du FCCP original, un enregistrement étant sélectionné pour chaque code postal, en général celui qui concerne le plus grand nombre de logementsNote 2. À l’aide de l’ILU du FCCP, les personnes dans un ensemble de données sur la santé seraient appariées uniquement aux AD qui sont représentées par l’ILU. Il en résulte des regroupements de zones à forte densité de population entourés de nombreuses AD qui ne sont pas appariés à des codes postaux (figure 2a). En revanche, le FCCP+ attribue la population rurale à des AD en fonction de poids de population et permet aux utilisateurs de s’assurer que l’ensemble de données global sur la santé qu’ils utilisent présente une répartition spatiale qui ressemble davantage à la répartition réelle de la population (figure 2b).

Statistiques descriptives — méthodes

Les codes postaux de l’ensemble de la population du Canada ont été tirés du questionnaire abrégé du Recensement de 2016. Tous les codes postaux de la population du Canada ont été traités au moyen du FCCP+, version 7B, en vue d’obtenir les variables suivantes : la province ou le territoire, le TML, le type de centre de population ou de région rurale et la région métropolitaine de recensement (RMR). Ce sont les enregistrements des codes postaux de novembre 2018Note 16 qui ont été utilisés dans le FCCP+, version 7B.

Le TML indique le mode de livraison du courrier attribué au code postal. Il est utile de tenir compte du TML dans l’évaluation de la précision du géocodage, car des études antérieures ont indiqué que la précision varie considérablement selon le TMLNote 17. Les TML les plus importants sont A (adresse municipale urbaine), B (immeuble d’appartements urbain) et le code postal rural (sans lettre, mais un TML « W » lui est attribué par le FCCP+). Les TML E, G et M indiquent des adresses d’affaires ou de gros destinataires de courrier, et le TML K indique des cases postalesNote 1. Le TML Z indique des codes postaux qui ont depuis été retirés par la Société canadienne des postesNote 1. Ces derniers ont été inclus, car les codes postaux qui sont tirés du Recensement de 2016 peuvent avoir été retirés depuis.

Les types de centre de population et de région rurale constituent des unités géographiques distinctes qui caractérisent le continuum urbain-rural à l’aide d’une combinaison de la taille de la population, de la contiguïté et de la densitéNote 20. Les noyaux de population sont définis comme des centres de population comptant au moins 50 000 habitants (RMR) ou 10 000 habitants (agglomération de recensement [AR]). Un noyau secondaire est semblable à un noyau du fait qu’il compte au moins 10 000 habitants, mais il est différent du fait qu’il s’agissait autrefois du noyau d’une AR qui a ensuite fusionné avec une RMR en croissance. Les banlieues comprennent les centres de population au sein d’une RMR ou d’une AR comptant moins de 10 000 habitants. Sinon, la région est considérée comme une région ruraleNote 20. Les RMR sont définies comme comptant une population totale d’au moins 100 000 habitants, et leur noyau doit compter au moins 50 000 habitants, tandis que les AR doivent avoir une population totale d’au moins 10 000 habitantsNote 20. Compte tenu des tailles d’échantillon, dans certaines analyses, les régions rurales au sein des RMR ou des AR ont été combinées aux régions rurales à l’extérieur des RMR ou des AR pour former les « régions rurales », et les centres de population à l’extérieur des RMR et des AR ont été combinés aux noyaux secondaires pour former les « centres de population secondaires ».

Étant donné que les codes postaux peuvent être attribués à plus d’une aire de diffusion (AD), le nombre d’appariements possibles entre chaque code postal et chaque AD (c.-à-d. les enregistrements dans le FCCP) a été calculé séparément à l’aide du FCCP original. À titre d’exemple, si un code postal a été apparié à trois AD possibles dans le FCCP, on a enregistré un chiffre de trois. Ces chiffres ont été fusionnés aux données du Recensement de 2016 pour obtenir des chiffres de population pour chaque appariement d’un code postal et d’une AD. Le pourcentage de la population ayant un code postal lié à une AD unique a été utilisé comme indicateur d’une plus grande précision du géocodage. Les chiffres de population et les pourcentages de la population liés à une ou à plusieurs AD ont été calculés selon la province ou le territoire, le TML et le type de centre de population ou de région rurale. On a également calculé le pourcentage de la population ayant un code postal lié à une subdivision de recensement (SDR), à une division de recensement (DR) ou à un secteur de recensement (SR) unique aux fins de comparaison. Les DR représentent des subdivisions des provinces et des territoires regroupant des municipalités voisines ayant souvent des services communsNote 20. Les SDR représentent des subdivisions des DR et sont généralement représentatives de municipalités ou de régions uniques considérées comme étant des équivalents municipaux à des fins statistiques (p. ex. les réserves indiennes)Note 20. Les SR sont uniquement situés au sein des RMR ou des AR et sont de petites régions stables comptant généralement une population de moins de 10 000 habitantsNote 20.

Résultats

La majorité des Canadiens ont été desservis par un type de mode de livraison (TML) A (adresse municipale urbaine, 70,6 %) ou B (adresse d’immeuble urbain, 9,8 %) ou avaient un code postal rural (16,7 %). Cependant, ces proportions variaient selon la province ou le territoire (tableau 1). Au Québec, en Ontario, en Alberta et en Colombie-Britannique, les proportions étaient semblables aux estimations nationales. Cependant, les codes postaux ruraux étaient plus courants dans les provinces de l’Atlantique (à l’exception du Nouveau-Brunswick, où les codes postaux ruraux ont été abandonnés par la Société canadienne des postes), au Manitoba, en Saskatchewan et dans les trois territoires. Le TML variait aussi considérablement d’un type de centre de population et de région rurale à l’autre. L’adresse municipale urbaine (TML = A) était la plus courante dans le noyau ou la banlieue d’une région métropolitaine de recensement (RMR) ou d’une agglomération de recensement (AR) ainsi que dans un noyau secondaire. Cependant, dans les centres de population et les régions rurales à l’extérieur d’une RMR ou d’une AR, les codes postaux ruraux étaient les plus courants.

Au Canada, 72,6 % des codes postaux de la population ont été appariés à une aire de diffusion (AD) unique et 9,8 % ont été appariés à deux AD (tableau 2). Cependant, ces proportions variaient selon la province ou le territoire, le TML et le type de centre de population ou de région rurale. Parmi les provinces et les territoires, des proportions élevées similaires de la population (68,0 % à 79,5 %) ont été appariées à une AD unique au Québec, en Ontario, au Manitoba, en Saskatchewan, en Alberta et en Colombie-Britannique. Cependant, à l’Île-du-Prince-Édouard, 48,0 % de la population a été appariée à cinq AD ou plus, et au Nunavut, 71,9 % de la population a été appariée à deux ou à trois AD. Selon le TML, les personnes ayant une adresse municipale urbaine (TML = A) et celles qui habitaient dans des immeubles d’appartements (TML = B) ont été appariées à une AD unique dans 85,3 % et 95,3 % des cas, respectivement. Cependant, les personnes ayant un code postal rural étaient plus souvent appariées à cinq AD ou plus (62,9 %) et étaient rarement appariées à une AD unique (13,9 %). Selon le type de centre de population ou de région rurale, les personnes vivant dans le noyau d’une RMR ou d’une AR ou dans un noyau secondaire ont été appariées à une AD unique dans la majorité des cas (de 74,9 % à 87,1 %). En revanche, les personnes vivant dans des régions rurales et des centres de population à l’extérieur des RMR et des AR étaient plus souvent appariées à plusieurs AD.

Le tableau 3 présente la proportion de personnes appariées à une AD unique selon des caractéristiques combinées. En général, les personnes ayant une adresse municipale urbaine (TML = A) ont été appariées à une AD unique dans la majorité des cas (72,6 % à 98,4 %), à l’exception de celles qui vivaient dans des banlieues au Nouveau-Brunswick et au Manitoba, dans des centres de population secondaires en Saskatchewan et en Alberta et dans des régions rurales dans les Prairies et en Colombie-Britannique. La plus grande précision a été observée chez les personnes vivant dans des immeubles d’appartements (TML = B) (appariement à une AD unique dans une proportion de 84,0 % à 100,0 %), à l’exception des régions rurales en Alberta et des centres de population secondaires au Manitoba. Les personnes ayant un code postal rural étaient généralement appariées moins fréquemment à une AD unique, mais les résultats variaient selon la province ou le territoire et selon la taille de la population. Les proportions de personnes appariées à une AD unique variaient considérablement pour tous les autres TML examinés. Il convient de souligner que les provinces et les territoires n’ont pas tous les TML et les types de centre de population ou de région rurale.

Le tableau 4 présente des estimations démographiques, la proportion de la population appariée aux trois TML les plus courants et la proportion de la population appariée à une AD unique, pour toutes les RMR au Canada. Pour la plupart des RMR, la vaste majorité de la population avait une adresse municipale urbaine (TML = A) et a été couplée à une AD unique. En Ontario, les RMR de Kingston, de Peterborough et du Grand Sudbury affichaient une proportion plus élevée de la population ayant un code postal rural (20,5 % à 24,6 %) et une proportion généralement plus faible de la population couplée à une AD unique (61,9 % à 70,2 %). Pour ce qui est de Barrie, en Ontario, seulement 52,5 % de sa population a été couplée à une AD unique malgré le fait que 80,7 % de la population avait une adresse municipale urbaine (TML = A).

Pour contextualiser ces résultats, les pourcentages de la population couplée à une subdivision de recensement (SDR), à une division de recensement (DR) ou à un secteur de recensement (SR) unique selon différentes caractéristiques sont présentés au tableau 5. En général, la plus grande partie de la population (89,3 %) a été appariée à une SDR unique, un pourcentage nettement plus faible ayant été observé à l’Île-du-Prince-Édouard (47,5 %) et en Nouvelle-Écosse (75,9 %), dans les régions rurales (51,1 % à 68,3 %) et dans les centres de population à l’extérieur d’une RMR ou d’une AR (67,9 %). La proportion de la population appariée à une SDR unique était extrêmement élevée pour les TML A, B, E, G et M (supérieure à 99 %), mais elle était considérablement plus faible pour les TML H et rural (43,5 % et 44,1 %). Les résultats obtenus pour les DR présentaient des tendances semblables à celles des SDR, mais le pourcentage d’appariement à une DR unique était plus élevé que pour une SDR. Près de 26,7 millions de Canadiens ont été appariés à un SR, dont 92,1 % ont été appariés à un SR unique. Le pourcentage des codes postaux appariés à un SR unique était plus faible pour les TML H, T, rural et Z ainsi que pour toutes les régions à l’extérieur d’une RMR ou d’une AR.

Discussion

Dans la présente étude, des codes postaux qui sont appariés à une aire de diffusion (AD) unique sont utilisés comme indicateur d’une plus grande précision dans l’attribution de variables propres aux quartiers à l’échelle de l’AD. Dans l’ensemble, 72,6 % de la population du Canada a été appariée à une AD unique, et cette proportion était plus élevée (87,1 %) lorsque l’analyse se limitait aux Canadiens habitant dans le noyau urbain d’une RMR ou d’une AR. Les personnes dont le type de mode de livraison (TML) se rapportait à une adresse municipale urbaine (TML = A) ou à un immeuble d’appartements (TML = B) étaient aussi plus souvent couplées à une AD unique. Ces estimations ont été présentées selon la province ou le territoire et selon des régions métropolitaines de recensement (RMR) et des agglomérations urbaines précises pour orienter les études menées à l’aide d’ensembles de données provinciaux et régionaux. Pour ce qui est des unités géographiques du recensement plus grandes, les pourcentages de la population ayant un code postal qui était couplé à une unité unique étaient de 89,3 % dans le cas des SDR, de 95,4 % dans le cas des DR et de 92,1 % dans le cas des SR.

En général, la constatation selon laquelle le géocodage dans les régions urbaines est plus précis correspond aux résultats présentés dans les études publiées. Plusieurs autres études ont examiné la précision des points du géocodage (c.-à-d. la latitude et la longitude), révélant que les codes postaux peuvent fournir des estimations ponctuelles relativement précises dans les centres urbains, mais que ces estimations sont moins précises dans les régions ruralesNote 17Note 21Note 22Note 23. Par exemple, une étude menée auprès de patients subissant un cathétérisme cardiaque à Calgary a révélé que les coordonnées liées aux codes postaux se trouvaient dans un îlot urbain de la résidence dans une proportion de 87,9 %Note 21. Dans une étude précédente portant sur la précision du géocodage de la latitude et de la longitude à l’aide du FCCP+, les distances médianes entre les points représentatifs de latitude et de longitude (c.-à-d. dans le FCCP+) et l’emplacement réel de la résidence étaient faibles (0,16 km à 0,33 km) au sein des collectivités d’au moins 10 000 habitants, mais assez grandes dans les régions rurales (5,60 km)Note 17.

En plus des variables liées à l’emplacement urbain et rural, les utilisateurs peuvent tenir compte de la variable du TML pour mieux évaluer la précision du géocodage des codes postaux. Dans une étude précédente, les codes postaux pour lesquels le TML était A et B ont affiché les plus courtes distances entre les points représentatifs de latitude et de longitude et l’emplacement réel de la résidence, tandis que les codes postaux ruraux présentaient certaines des distances les plus longuesNote 17. D’autres TML affichaient divers degrés de précision, mais la présente étude indique que ces TML sont utilisés pour environ 2,8 % de la population canadienne. La précision dans ce groupe est hétérogène, car elle dépend de la route liée au code postal. Par exemple, dans une route rurale (TML = H), la route peut partir d’un bureau de poste et peut suivre un parcours non linéaire vers une région rurale, traversant ce faisant plusieurs AD. Le TML est fourni à titre de variable de sortie par le FCCP+, et le programme signale également que certains TML (c.-à-d. des codes postaux associés à des entreprises) sont possiblement non résidentiels dans le fichier de sortie des cas problèmes. Le FCCP+ extrait également certains TML qui sont plus susceptibles d’être appariés à plusieurs AD et relie des données contextuelles à un code postal à trois caractères moins précis (code de région de tri d’acheminement) pour tenir compte de cette incertitude.

Le FCCP+ est particulièrement utile pour attribuer des régions géographiques du recensement (p. ex. des AD) dans des études où l’on a relié des covariables propres aux quartiers à un ensemble de données sur la santé. Les AD sont souvent utilisées, car elles constituent les plus petites unités géographiques issues des données du recensement de Statistique Canada accessibles au public. En outre, la plupart des indicateurs socioéconomiques propres aux quartiers sont produits à l’échelle de l’AD, comme l’indice de marginalisation canadien (Can-Marg)Note 24 et l’indice de défavorisation matérielle et sociale du QuébecNote 25. Dans les recherches sur l’hygiène de l’environnement, plusieurs indicateurs environnementaux sont également produits à l’échelle de l’AD, comme dans la Base de données sur l’accessibilité à la vie active dans les milieux de vie au Canada (AVA-Can)Note 26Note 27. La plupart des études qui reposent sur ces données sont axées sur les centres de population urbains, pour lesquels le géocodage à l’échelle de l’AD est très précis. De plus, de nombreuses covariables contextuelles sont spatialement autocorrélées, c’est-à-dire que les quartiers adjacents (c.-à-d. les AD) pourraient présenter des valeurs semblables des covariables qui leur sont attribuées. Par exemple, la concentration ethnique pourrait être semblable dans les AD adjacentes d’un centre urbain donné. En pareil cas, si un code postal est attribué aléatoirement à une AD adjacente, l’estimation de la concentration ethnique propre au quartier est tout de même susceptible d’être semblable. Par conséquent, des problèmes peuvent survenir dans les études qui comprennent davantage de régions rurales ou une covariable propre aux quartiers particulièrement hétérogènes dans l’ensemble du territoire.

Pour ce qui est des ensembles de données principalement urbains (p. ex. des cohortes à l’échelle des villes), l’attribution des AD peut par conséquent être considérée comme étant assez précise. Cependant, dans les cohortes nationales ou les cohortes qui sont principalement rurales, l’attribution des AD peut poser problème. En pareil cas, si un ensemble de données démographiques est suffisamment vaste et si la question de recherche exige que la répartition de l’ensemble de la population soit seulement généralement représentative, l’incidence des AD imprécises peut être atténuée par l’attribution moyenne de l’AD dans l’ensemble du territoire d’après une pondération en fonction de la population. Cependant, si la question de recherche exige que l’AD corresponde à des membres précis d’une cohorte, comme dans la comparaison des caractéristiques des personnes et des caractéristiques des quartiers, ou si la cohorte est de petite taille, cette imprécision du géocodage peut alors présenter une sérieuse limite. En pareil cas, une autre approche recommandée pourrait être de regrouper les AD en une unité plus grande, comme une SDR ou une DR, pour accroître la précision de l’appariement des codes postaux aux régions géographiques du recensement.

Le FCCP+ peut permettre aux utilisateurs de relever différentes sources d’erreurs possibles dans un ensemble de données d’entrée sur la santé en offrant une certaine fonctionnalité de diagnostic. Les codes postaux manquants ou invalides dans le fichier source seront signalés s’ils ne figurent pas dans le FCCP. En pareil cas, les utilisateurs peuvent vérifier manuellement les codes postaux, les tranches d’adresses et l’orthographe des rues à l’aide de l’outil de recherche sur Internet de la Société canadienne des postes ou vérifier ces codes postaux par rapport à d’autres sources (p. ex. auprès des membres d’une collectivité en particulier). Dans son fichier de sortie, le FCCP+ présente aux utilisateurs un indicateur de qualité des enregistrements du FCCP qui ont été géocodés au moyen du système automatiséNote 16. Le FCCP+ signale également les codes postaux non résidentiels probables, c’est-à-dire pour lesquels le TML est E, G ou M. Étant donné que le FCCP+ applique une pondération en fonction de la population aux régions rurales pour les relier à des régions géographiques du recensement, il serait peut-être préférable d’utiliser l’indicateur de lien unique du FCCP pour attribuer une région géographique à ces codes postaux signalés. La Société canadienne des postes peut également retirer des codes postaux et les rétablir (ou les « recréer ») plus tard dans une autre région. Par conséquent, les utilisateurs sont invités à vérifier les enregistrements lorsque le TML = Z, une indication que des codes postaux ont été retirés, et à reconnaître qu’il peut ne pas y avoir de correspondance exacte entre l’emplacement actuel d’un code postal et son emplacement antérieur. Cela peut s’avérer particulièrement pertinent dans les études longitudinales sur la santé. Les TML antérieurs sont également fournis dans le fichier de sortie et peuvent être utilisés pour vérifier le type qui était associé à un code postal avant que ce dernier ne soit retiré et rétabli.

Un autre facteur dont il faut tenir compte au moment d’utiliser le FCCP+ afin d’attribuer des régions géographiques du recensement est que le programme repose sur la pondération selon la population du recensement pour effectuer l’attribution aléatoire des régions géographiques du recensement. En conséquence, le programme suppose que la répartition géographique de l’ensemble de données sur la santé est généralement semblable à celle de la population canadienne. Cependant, ce n’est peut-être pas toujours le cas. Par exemple, des chercheurs menant une étude sur la santé auprès d’une population autochtone dans une réserve pourraient vouloir sélectionner manuellement les enregistrements du FCCP qui sont appariés à la réserve plutôt qu’à une ville adjacente, sachant que les répondants à l’étude vivent dans la réserve elle-même. De façon similaire, des chercheurs qui étudient la population âgée pourraient vouloir sélectionner les enregistrements du FCCP qui comprennent des résidences où vivent des personnes âgées. Par conséquent, l’utilisation de la répartition de la population du Canada pour effectuer l’attribution aléatoire des régions géographiques du recensement, surtout dans les régions rurales, constitue une limite importante du programme FCCP+ pour des ensembles de données spécialisés sur la santé dans lesquels la répartition peut être différente de celle de la population en général.

Limites

La présente étude repose sur les codes postaux recueillis dans le cadre du Recensement de la population de 2016. La variable du code postal provient de trois sources possibles : les fichiers d’adresses originaux de Statistique Canada (c.-à-d. le code postal utilisé pour l’envoi par la poste du questionnaire du recensement), les codes postaux déclarés par les répondants et les codes postaux mentionnés dans le formulaire 3 du recensement (le questionnaire individuel). La préférence a été accordée aux codes postaux valides obtenus à partir des fichiers d’adresses utilisés pour l’envoi par la poste. Dans les rares cas où un code postal valide n’a pas pu être obtenu à partir de l’une de ces trois sources, il a été imputé au moyen du code postal d’un donneur. Une autre source d’erreur provient du fait que les répondants n’ont pas nécessairement déclaré le code postal de leur lieu de résidence et peuvent plutôt avoir déclaré le code postal d’une entreprise ou une case postaleNote 20. La mesure dans laquelle cette situation est survenue dans l’ensemble de données du recensement n’est pas connue à l’heure actuelle.

Les appariements des codes postaux avec les AD sont tirés du FCCP, lequel est régulièrement enrichi de nouveaux codes postaux créés par la Société canadienne des postesNote 2. Bon nombre de ces enregistrements sont vérifiés manuellement par Statistique Canada lorsqu’ils sont ajoutés. Cependant, les erreurs de localisation dans le FCCP original qui n’ont pas été corrigées pendant les vérifications manuelles engendreraient aussi des erreurs dans le traitement du FCCP+ et ont par conséquent une incidence sur l’attribution du TML et les chiffres de codes postaux produits à l’échelle des AD.

Conclusions

La présente étude souligne l’importance de tenir compte de plusieurs variables géographiques, notamment du type de mode de livraison (TML), pour déterminer la précision de l’appariement des codes postaux aux régions géographiques du recensement. En général, la majorité des Canadiens sont des résidents des centres urbains (69,4 %) ou leur TML est de type A ou B (80,4 %), et la plupart d’entre eux ont été couplés à une AD unique (85,3 % à 95,3 %). Par conséquent, on peut attribuer de manière relativement précise des codes postaux aux covariables propres aux quartiers à l’échelle de l’AD dans les études portant sur les régions urbaines du Canada. Quelques RMR, comme Barrie, en Ontario, offrent une moins grande précision.

Cependant, dans les régions rurales et les régions pour lesquelles des codes postaux ruraux sont attribués, où les codes postaux sont susceptibles de chevaucher les limites de plusieurs AD, les codes postaux étaient plus souvent appariés à plusieurs AD. En pareil cas, un algorithme d’attribution aléatoire est utilisé dans le FCCP+ pour sélectionner une AD et, à l’échelle de la population, attribuer l’AD de manière à reproduire la répartition de l’ensemble de la population. Cependant, dans le cas de petits ensembles de données sur la santé (c.-à-d. moins représentatifs) ou dans le cas des ensembles de données pour lesquels il pourrait s’avérer important d’apparier avec précision le quartier aux covariables individuelles, les codes postaux peuvent ne pas produire des données géographiques suffisamment détaillées pour le géocodage à l’échelle de l’AD. En pareil cas, des renseignements géographiques supplémentaires (p. ex. des fichiers d’adresse) ou le regroupement en une unité géographique du recensement plus grande (p. ex. les secteurs de recensement) pourraient contribuer à atténuer l’incidence des erreurs de géocodage.

Références
Signaler un problème sur cette page

Quelque chose ne fonctionne pas? L'information n'est plus à jour? Vous ne trouvez pas ce que vous cherchez?

S'il vous plaît contactez-nous et nous informer comment nous pouvons vous aider.

Avis de confidentialité

Date de modification :