Statistique Canada
Symbole du gouvernement du Canada

Liens de la barre de menu commune

Résultats

Avertissement Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Méthodes
Résultats
Discussion
Remerciements

Le couplage d’enregistrements est utilisé dans  les études sur la santé pour recueillir de l’information complète, combler des écarts dans des ensembles de données actuelles ou améliorer la qualité des données1, 2. Notamment, grâce à la confirmation du décès de participants à des enquêtes, aux cohortes visées par des études, ou aux sources de données administratives, tels les dossiers de malades hospitalisés, il a été possible d’étudier les rapports entre le décès et des facteurs comme le mode de vie, la profession, les modalités de traitement, les antécédents médicaux et la géographie3-20.

Dans la même optique, le couplage d’enregistrements de naissances et de mortinaissances et d’enregistrements de décès ou d’hospitalisations a permis d’étudier la morbidité et la mortalité des mères, des fœtus et des nourrissons selon les caractéristiques de la mère et du nourrisson21-24. La technique sert également à valider de l’information autodéclarée25, 26, à décrire les caractéristiques d’enregistrements non appariés27, à évaluer la comparabilité ou la qualité de fichiers de données générées par des méthodes de couplage probabiliste et déterministe28, à réduire la sous‑détermination de la prévalence de maladies29 et à contrôler le rendement du système de santé30, 31. En l’absence de registres de maladies, le couplage d’enregistrements constitue un moyen économique et efficient de surveiller l’incidence et la prévalence de celles-ci32-35.

La présente étude a été motivée par la nécessité d’évaluer la couverture du couplage de l’Enquête sur la santé dans les collectivités canadiennes (ESCC) et de l’Information‑santé orientée vers la personne (ISOP), une base de données administrative de dossiers d’hôpital. La recherche initiale sur le taux de couplage de l’ESCC et de l’ISOP a consisté à estimer la part des participants à l’ESCC qui avaient été hospitalisés entre 1994‑1995 et 2004‑2005, mais il reste à évaluer la couverture du fichier couplé36. L’évaluation de la couverture est indispensable si le fichier couplé doit servir à la recherche épidémiologique. Il importe de déterminer si les conclusions seront biaisées, à savoir si les participants qui possèdent certaines caractéristiques sont plus susceptibles d’être couplés que ceux qui ne les possèdent pas.

L’ISOP et l’ESCC sont des sources de données complémentaires. L’ISOP ne renferme pas de renseignements sur les déterminants non médicaux de la santé, comme les facteurs socioéconomiques et les facteurs liés au mode de vie. Ainsi, les dossiers d’hôpital ne renseignent aucunement sur l’usage du tabac ou l’indice de masse corporelle (IMC), deux facteurs de risque importants. En revanche, l’ESCC est riche en information sur l’état de santé et les déterminants de la santé, mais pauvre en détails nécessaires à l’étude de l’hospitalisation. La fonte de l’ISOP et de l’ESCC réduit bon nombre des limites de chaque source et facilite dès lors une compréhension approfondie des raisons pour lesquelles les Canadiens sont mis en contact avec le système de soins de santé et de leurs résultats lorsqu’ils se trouvent dans le système.

Les deux principaux objectifs de la présente étude étaient : 1) de calculer le taux de couverture de l’ESCC et de l’ISOP couplées; 2) de cerner les caractéristiques des participants au cycle 1.1 de l’ESCC dont il était moins probable que les autres qu’ils se trouvent dans le fichier couplé.

Méthodes

Sources de données

Enquête sur la santé dans les collectivités canadiennes

L’Enquête sur la santé dans les collectivités canadiennes (ESCC) est une enquête transversale qui recueille de l’information sur l’état de santé, le recours aux soins de santé et les déterminants de la santé. Elle a pour champ d’observation la population à domicile de 12 ans et plus des provinces et des territoires, sauf les membres réguliers des Forces canadiennes, les personnes vivant en établissement et les résidents des réserves indiennes, des autres établissements autochtones et de certaines régions éloignées. Son taux de couverture a été de 98 % dans les provinces, de 97 % dans les Territoires du Nord‑Ouest, de 90 % au Yukon et de 71 % au Nunavut.

Les données du cycle 1.1 ont été recueillies du 1er septembre 2000 au 3 novembre 2001 inclusivement auprès d’un échantillon de 131 535 personnes. Le taux de réponse a été de 84,7 %. Tous les renseignements donnés en réponse à l’ESCC, notamment les numéros des régimes provinciaux d’assurance‑maladie et les codes postaux, sont autodéclarés par les répondants, et l’ampleur de l’erreur de ces variables est inconnue. Cependant, les applications de saisie qu’utilisent les intervieweurs comprennent des fonctions de dépistage des réponses incohérentes ou non incluses dans la fourchette de valeurs permises et des séquences alphanumériques non valables. Un rapport publié offre de plus amples renseignements sur l’ESCC37.

Les participants à l’ESCC ont été invités à autoriser le couplage de l’information recueillie lors de l’interview et d’information provinciale sur leur santé, notamment le recours antérieur et actuel à des services tels ceux d’hôpitaux, de cliniques ou de cabinets de médecin ou à d’autres services fournis par la province; 91 % ont accordé l’autorisation demandée. L’échantillon utilisé aux fins de la présente étude réunit 72 354 (66,5 %) personnes âgées de 12 ans et plus dans toutes les provinces et tous les territoires sauf le Québec qui ont consenti au couplage et fourni un numéro d’assurance‑maladie (NAM) valide (annexe A). Les enregistrements de l’ISOP concernant le Québec ne peuvent pas être couplés à ceux de l’ESCC, car les dossiers d’hôpital du Québec fournis à Statistique Canada contiennent des numéros d’assurance‑maladie brouillés, des codes postaux incomplets et ne précisent aucune date de naissance.

Des poids d’enquête ont été utilisés afin que les estimations tirées des données de l’ESCC soient représentatives de la population cible plutôt que du seul échantillon. « Poids d’enquête » s’entend du nombre de personnes contenues dans la population que représente chaque répondant. Il témoigne des différentes probabilités de sélection et de réponse. Par conséquent, chaque enregistrement est pondéré de l’inverse de la probabilité de sélection de la personne et de recueil de sa réponse38. Le couplage d’enregistrements nécessite le recours à des poids d’enquête supplémentaires, car les répondants ne consentent pas tous au couplage, et ceux qui le font ne fournissent pas tous un NAM valide. Aux fins de la présente étude, des poids d’enquête ajustés pour tenir compte du consentement au couplage et de la déclaration d’un NAM valide ont été calculés.

Statistique Canada n’a pas accès aux bases de données de l’assurance‑maladie provinciale dans lesquelles vérifier les NAM déclarés par les répondants de l’ESCC. À la place, les provinces et les territoires sans exception ont fourni des formules de contrôle numérique qui confirment que les NAM sont au moins vraisemblables. Si les chiffres de contrôle ne peuvent pas remplacer des bases de données qui contiennent noms et prénoms, dates de naissance, adresses et NAM, ils permettent quand même de déceler les erreurs de transcription, par exemple l’inversion de deux chiffres, et constituent un moyen simple de distinguer les numéros valables de séries de chiffres aléatoires.

Données d’hôpital

La base de données de l’Information‑santé orientée vers la personne (ISOP) tenue par Statistique Canada contient de l’information sur la radiation des patients (pour cause de congé et de décès à l’hôpital) de la quasi‑totalité des hôpitaux de soins actifs et de quelques hôpitaux psychiatriques, hôpitaux pour malades chroniques et établissements de réadaptation.

L’ISOP est un ensemble de données au niveau de la personne constitué des enregistrements des congés (parfois des congés multiples donnés à la même personne) contenus dans la Base de données sur la morbidité hospitalière (BDMH). Les antécédents d’hospitalisation de chaque malade peuvent être établis d’après les enregistrements séquentiels au niveau de la personne de l’ISOP. Au cours du couplage, les enregistrements se rapportant à un même particulier sont repérés au moyen du NAM, d’information démographique et de renseignements sur les diagnostics et les interventions (sexe, date de naissance, procédures propres à un sexe, et autres)39.

Les dossiers d’hôpital de l’exercice écoulé sont ajoutés chaque année à l’ISOP. Chaque fois que les données d’une année sont entrées dans le système, le processus complet de l’ISOP est exécuté afin de garantir la cohérence interne de l’information démographique au niveau de la personne concernant les patients ayant reçu de multiples congés.

Des études de données hospitalières obtenues par une seconde saisie, qui visent à confirmer l’exactitude de celles-ci, ont démontré la grande qualité des éléments de données administratifs et non médicaux (essentiels au couplage d’enregistrements). Ainsi, 99 % d’un échantillon aléatoire d’enregistrements de congé à la suite d’un séjour à l’hôpital de septembre à la fin novembre 2000 contenait des NAM exacts, et 91 % des codes postaux étaient sans erreur40.

Statistique Canada possède des données d’hôpital comprenant les NAM pour toutes les provinces (sauf le Québec) et les Territoires du Nord‑Ouest de 1994‑1995 à ce jour, et des données de même type pour certaines provinces de 1992‑1993 et 1993‑1994.

Bien que la base de données de l’ISOP comprenne la vaste majorité des enregistrements de la BDMH, quelque 3 % de ceux des malades âgés de 12 ans et plus (la population cible de la présente étude) en étaient exclus à cause de NAM manquants ou non valides39.

Du 1er septembre 2000 au 3 novembre 2001 inclusivement, 1 624 972 personnes âgées de 12 ans et plus ont reçu 2,3 millions de congés d’hôpitaux de soins actifs hors du Québec. L’étude ne s’étendait pas aux congés d’hôpitaux de soins autres que de soins actifs, car leur couverture n’est pas uniforme d’une province à l’autre.

Les populations cibles de l’ESCC et de l’ISOP diffèrent quelque peu. Par exemple, l’ESCC exclut les membres à plein temps des Forces canadiennes de même que les personnes vivant dans les réserves indiennes, en établissement (p. ex. foyers de soins infirmiers et prisons) et dans certaines régions éloignées. L’ISOP est un recensement qui dénombre les hospitalisations, y compris parmi ces populations. Par souci d’assurer la correspondance des populations de l’ESCC et de l’ISOP, les hospitalisations parmi les personnes vivant dans les réserves ou en établissement ont été exclues de l’analyse.

La population des réserves est une variable de recensement dérivée, constituée par classement des subdivisions de recensement (SDR) selon des critères établis par Affaires indiennes et du Nord Canada (AINC), et comprenant des SDR choisies parmi les collectivités septentrionales de la Saskatchewan, des Territoires du Nord‑Ouest et du Yukon41. Les personnes vivant en établissement ont été identifiées par consultation du Fichier de conversion des codes postaux (FCCP+)42 et d’une liste d’établissements servant à l’Enquête sur les établissements de soins pour bénéficiaires internes43. Les hospitalisations de 31 330 personnes vivant dans les réserves et dans des régions apparentées ont été éliminées de l’ISOP, tout comme celles de 21 299 personnes vivant en établissement. L’élimination des 52 629 enregistrements en question, soit quelque 3 % des malades hospitalisés selon l’ISOP au cours de la période à l’étude, a eu pour résultats d’adapter la population visée par l’ISOP à la population cible de l’ESCC.

Techniques d’analyse

Couplage d’enregistrements probabiliste

Les participants à l’ESCC qui avaient été hospitalisés ont été identifiés par couplage d’enregistrements probabiliste. Le couplage de l’ESCC et de l’ISOP a été effectué au moyen du Système généralisé de couplage d’enregistrements (SGCE), un logiciel développé par Statistique Canada. Si les deux sources de données contiennent de nombreuses variables, elles n’ont que quelques champs en commun, lesquels sont suffisamment distincts pour effectuer l’appariement. Un participant à l’ESCC n’était réputé avoir été hospitalisé que si l’ISOP contenait un enregistrement comprenant un NAM ou des caractéristiques démographiques comparables (date de naissance, sexe, code postal) et précisait une date d’admission à un établissement de soins actifs entre le 1er septembre 2000 et le 3 novembre 2001.

Le couplage probabiliste ne nécessite pas la correspondance complète des variables d’appariement. La qualité de l’appariement des enregistrements est plutôt évaluée par l’application d’algorithmes qui mesurent la probabilité d’un appariement correct1-44 (figure 1). Des points étaient attribués ou déduits, selon la similitude des valeurs des champs. À titre d’exemple, un pointage positif élevé était attribué là où les NAM et les provinces de délivrance étaient identiques; si les valeurs étaient comparables, sans toutefois être exactes, un pointage positif moindre était accordé pour tenir compte de la correspondance partielle; des points étaient déduits si les valeurs contenues dans les deux enregistrements divergeaient carrément.

Figure 1
Évaluation et pointage types de paires d’enregistrements de l’Enquête sur la santé dans les collectivités canadiennes (ESCC) et de l’Information-santé orientée vers la personne (ISOP) au moyen du Système généralisé de couplage d’enregistrements (SGCE)

Le nombre de points alloués à chaque paire de variables de couplage était à proportion de leur importance en tant que variables d’appariement, ce qui était normalement fonction de leur unicité. Ainsi, comme il n’existe que deux valeurs possibles du sexe du participant/malade, le nombre de points attribués à la correspondance de ces valeurs était inférieur au pointage accordé si les codes postaux ou les NAM correspondaient.

Le poids de couplage total attribué à chaque paire d’enregistrements ESCCISOP était calculé en additionnant les points alloués à chaque paire de variables d’appariement. Plus le poids de couplage total était élevé, plus il était probable que les deux enregistrements concernaient la même personne. Les poids de couplage totaux répondent idéalement à une distribution bimodale. Les paires d’enregistrements qui recueillaient un pointage supérieur au seuil choisi étaient considérées comme des appariements vrais, tandis que celles dont le poids y était inférieur étaient rejetées. Pour éviter de devoir effectuer un examen manuel, les analystes ont fixé des seuils d’exclusion identiques aux fins de l’étude, si bien que l’une seulement des deux valeurs (appariement et non‑appariement) pouvait être attribuée à chaque paire d’enregistrements.

Résultats

Afin d’évaluer la couverture du couplage du cycle 1.1 de l’ESCC et de l’ISOP, le nombre de personnes admises à l’hôpital selon chaque source de données a été comparé. Des poids de recensement, ajustés en fonction du consentement au couplage et de la validité du NAM, ont été appliqués aux enregistrements des participants à l’ESCC pour lesquels des données ont été repérées dans la base de données de l’ISOP. Le nombre d’hospitalisations selon l’ISOP était considéré comme la norme. Le taux de couverture a été calculé en divisant le nombre estimatif pondéré de participants à l’ESCC dont des données ont été repérées dans l’ISOP par le nombre selon l’ISOP, moins les enregistrements des personnes vivant dans les réserves indiennes ou des régions apparentées ou en établissement, puis en multipliant le quotient par 100. Les écarts entre les données de l’ISOP et les estimations pondérées de l’ESCC ont été examinés. Des erreurs‑types et des intervalles de confiance de 95 % ont été calculés pour les taux de couverture par la méthode du bootstrap. La signification statistique a été soumise à un test t (p < 0,05)45, 46.

Selon l’ISOP, 1 572 343 personnes ont été admises à un hôpital de soins actifs (excluant ceux du Québec), du 1er septembre 2000 au 3 novembre 2001 inclusivement (tableau 1). Les estimations pondérées de l’ESCC, rajustées pour tenir compte du consentement au couplage et d’un NAM valide, étaient inférieures de 7,7 % (1 451 272) à cette donnée.

Tableau 1
Nombre de personnes hospitalisées dans des hôpitaux de soins actifs et taux de couverture, du 1er septembre 2000 au 3 novembre 2001 inclusivement, selon des caractéristiques choisies et la source de données, population des personnes âgées de 12 ans et plus, le Canada excluant le Québec

Les taux de couverture étaient comparables pour les hommes et pour les femmes (91,0 % et 93,1 %). Les taux provinciaux ne différaient pas significativement du taux pour le reste du Canada. Toutefois, le nombre estimatif d’habitants des territoires qui ont été hospitalisés selon l’ESCC était significativement plus élevé que la donnée de l’ISOP. Par conséquent, le taux de couverture des territoires est supérieur à 100 %.
Les taux de couverture de la plupart des groupes d’âge étaient comparables, à ceci près que celui des 75 ans et plus (76,2 %) était passablement inférieur à la donnée correspondante pour la tranche des 12 à 74 ans (96,4 %).

Discussion

Le taux de couverture significativement moindre des personnes âgées de 75 ans et plus était prévu, car les deux sources de données ne concernent pas des populations identiques. L’ESCC exclut les personnes vivant en établissement, lesquelles sont incluses dans les données sur l’hospitalisation (ISOP). Or, les résidents d’établissements sont beaucoup plus nombreux parmi les personnes âgées que parmi les jeunes : dans l’ensemble, moins de 2 % des Canadiens entrent dans cette catégorie, donnée qui passe à 16 % pour la tranche des 75 ans et plus47.

À défaut de renseignements directs dans les enregistrements de l’ISOP sur le lieu de résidence des malades, le code postal conjugué au FCCP+ et à la liste des établissements de soins pour bénéficiaires internes a servi à déterminer si les malades vivaient en établissement. De cette façon, plus de 20 000 résidents d’établissements ont été identifiés et supprimés de l’ISOP au moyen du FCCP+. Néanmoins, le taux de couverture des personnes âgées de 75 ans et plus est demeuré significativement inférieur aux taux se rapportant aux personnes plus jeunes.

Le recours au FCCP+ et à la liste des établissements de soins pour bénéficiaires internes conjugués au seul code postal n’est pas idéal. Les établissements habités par la majorité de la population dont le code postal était le même étaient plus susceptibles que les autres d’être identifiés, puis éliminés des données de l’ISOP. Qui plus est, les codes postaux des établissements en milieu urbain sont distinctifs, et la probabilité que leurs résidents soient éliminés de l’ISOP était supérieure à la normale. Bien souvent, le même code postal est attribué à de nombreux secteurs de dénombrement et aires de diffusion situés en milieu rural, dans la banlieue éloignée ou dans de petites villes. Leur codage est donc beaucoup moins précis que ne l’est celui des zones urbaines centralisées, lesquelles sont normalement rattachées à un seul secteur de dénombrement ou à une seule aire de diffusion. Il s’ensuit que les données de l’ISOP ont probablement continué à tenir compte des résidents d’établissements de milieux ruraux, de la banlieue éloignée et de petites villes.

Le taux de couverture dans les territoires pose également problème, étant donné que les estimations couplées ESCCISOP ont dépassé la norme (ISOP). Toutefois, cette situation n’est pas inquiétante, car le petit nombre d’enregistrements de l’ESCC couplés à l’ISOP (124) écarte le risque d’analyses futures englobant cette sous‑population. Le taux de couverture des territoires était de 113 % avant que la population des réserves soit éliminée des données de l’ISOP, après quoi il est passé à 163 %. Il reste à déterminer pourquoi l’estimation après couplage de l’ESCC et de l’ISOP est de loin supérieure aux données de l’ISOP. Les enregistrements des participants à l’ESCC habitant les territoires ont été examinés afin de constater si des poids d’enquête élevés avaient été attribués à certains d’entre eux, ce qui pourrait expliquer l’écart entre les données de l’ISOP et celles issues du couplage ESCC-ISOP. Aucun poids divergent n’a été constaté : la moyenne était de 51, et les poids se situaient tous dans la fourchette de 11 à 178.

Par ailleurs, il était impossible de cerner les hospitalisations de personnel militaire afin de les éliminer de l’ISOP. Les membres à plein temps des Forces canadiennes sont exclus de l’ESCC, et leur prise en compte pourrait influer sur le taux de couverture.

Conclusion

La valeur du couplage d’enregistrements pour les études épidémiologiques de la santé de la population n’est plus à démontrer. L’appariement d’information tirée de données administratives sur la santé recueillies régulièrement, comme celles de l’ISOP, et de données d’enquête, comme les résultats de l’ESCC, nous procure des enseignements riches sur les déterminants de la santé, diverses catégories de recours aux soins de santé et les résultats en matière de santé. Or, l’évaluation de la couverture est une condition préalable aux analyses qui regroupent de l’information sur la santé de sources multiples en prenant appui sur le fichier couplé ESCCISOP.

La présente évaluation démontre que le taux de couverture global est élevé, dépassant souvent les 90 %, bien qu’il soit plus faible dans le cas de certains participants à l’ESCC, notamment les personnes âgées. Cependant, cette restriction n’est pas un obstacle, pourvu que les utilisateurs du fichier reconnaissent explicitement que les conclusions ne concernent que la population générale des ménages (population cible de l’ESCC) et non la population totale, particulièrement les personnes vivant en établissement. 

Remerciements

L’auteure remercie Claude Nadeau de son aide et de ses judicieux commentaires.