Utilisation des numéros d'assurance-maladie personnels pour coupler le Registre canadien du cancer et la Base de données sur les congés des patients

par Dianne Zakaria, Richard Trudeau, Claudia Sanmartin, Patricia Murison, Gisèle Carrière, Maureen MacIntyre, Donna Turner, Brandon Wagar, Mary Jane King, Kim Vriends, Ryan Woods, Gina Lockwood et Rabiâ Louchini

Les couplages de données améliorent l’utilité de l’information provenant de sources différentes (par exemple, bases de données administratives, recensements, enquêtes) et fournissent un point de vue qui n’est pas disponible lorsque les sources de données sont utilisées de façon isolée. Le couplage des données des registres du cancer et de données administratives sur la santé offre des occasions d’étudier les tendances d’utilisation des soins de santé (y compris les traitements) des patients atteints d’un cancerNote 1-3. Le Registre canadien du cancer (RCC)Note 4, qui comprend des identificateurs de patient uniques qui facilitent le couplage des enregistrements, a fait l’objet d’un couplage probabiliste avec les données du recensement et les données sur la mortalité, afin d’examiner les résultats en matière de cancer de sous-groupes clésNote 5.

La présente étude examine la faisabilité et la validité de l’utilisation des numéros d’assurance-maladie personnels (NAM) pour coupler de façon déterministe le RCC et la Base de données sur les congés des patients (BDCP), afin d’obtenir des données sur les hospitalisations des personnes atteintes d’un cancer primaire. Étant donné que les noms des patients ne sont pas saisis dans la BDCP, les NAM attribués par les provinces sont essentiels pour le couplage, et ils ont été utilisés auparavant pour des couplages de données déterministes en Ontario et au ManitobaNote 6-8. On décrit les méthodes utilisées pour coupler le RCC et la BDCP dans neuf provinces et on évalue la qualité de ce couplage déterministe. Les détails sur les taux de couplage, la correspondance des identificateurs démographiques et des diagnostics cliniques, et les admissions à l’hôpital à l’extérieur de la province sont présentés pour les cancers de la prostate, du sein chez la femme, colorectaux et du poumon, qui rendent compte ensemble de plus de la moitié des cancers primaires diagnostiqués chaque annéeNote 9. Les cancers diagnostiqués de 2005 à la fin de 2008 comportant un NAM valide ont été inclus dans le couplage. Étant donné que les territoires ont un moins grand nombre de cancers et que le Québec ne soumet pas de données à la BDCP, les cancers déclarés par ces secteurs de compétence ont été exclus du couplage.

Données et méthodes

Sources des données

Depuis 1992, le RCC a recueilli des données démographiques et cliniques concernant les résidents du Canada ayant reçu un diagnostic de tumeur primaireNote 4. Les données du RCC comprennent le nom de la personne (nom de famille courant, nom de famille à la naissance et prénom), le sexe et la date de naissance; le code postal du lieu de résidence et le NAM au moment du diagnostic sont inclus dans l’enregistrement ou les enregistrements tumeur de chaque personne.

Statistique Canada utilise le couplage d’enregistrements internes pour s’assurer que toutes les données concernant une personne sont reliées à un identificateur unique au niveau de la personne. Si un registre provincial ou territorial du cancer soumet un nouvel enregistrement et que le couplage d’enregistrements montre que la personne en question est enregistrée dans le RCC, les registres du cancer concernés sont consultés, afin de confirmer que le nouvel enregistrement concerne une personne déjà dans le RCC. Si tel est le cas, cet enregistrement reçoit le même identificateur au niveau de la personne que les autres enregistrements pour cette personne.

Comme le NAM est propre aux personnes vivant dans une province ou un territoire particulier et représente un identificateur clé des bases de données sur les congés des hôpitauxNote 10, il est idéal pour les couplages déterministes. Par ailleurs, étant donné que le lieu de résidence et le NAM personnel au moment du diagnostic sont saisis dans le RCC et couplés à un identificateur au niveau de la personne, les personnes ayant reçu un diagnostic de tumeur primaire dans plus d’une province ou d’un territoire auront plus d’un NAM qui peut servir au couplage avec la BDCP. C’est donc dire que chaque personne dans le RCC pourra être couplée à des épisodes d’hospitalisation liés à tous ses cancers primaires et aux NAM associés dans le RCC. Toutefois, si une personne enregistrée comme ayant une tumeur déménage dans une autre province ou un autre territoire et reçoit un nouveau NAM, les épisodes d’hospitalisation subséquents en fonction du nouveau NAM ne pourront être obtenus grâce au couplage, à moins qu’un nouveau cancer primaire ne soit enregistré dans le RCC sous le nouveau NAM.

Pour l’étude actuelle, des analyses ont été menées au sujet d’un instantané du RCC (4 avril 2012), qui comprenait 2 301 833 personnes et 2 483 305 tumeurs diagnostiquées de 1992 à la fin de 2008.

La BDCP est une base de données nationale (qui exclut le QuébecNote 11) comprenant des renseignements sur toutes les radiations (congés, décès, sorties et transferts, sauf les mortinaissances et les donneurs décédés) d’établissements de soins de courte durée au Canada. Depuis son avènement, en 1963, la couverture et le contenu de la BDCP ont changé considérablement. Au cours de l’exercice 2004-2005, les établissements soumettaient directement ou indirectement (par l’entremise des ministères de la Santé) des données à la BDCP au moyen de la Classification statistique internationale des maladies et des problèmes de santé connexes, Dixième révision, Canada (CIM-10-CA)Note 12, pour coder les diagnostics, et de la Classification canadienne des interventions en santé (CCI)Note 13, pour coder les diagnostics et les interventions thérapeutiques (tableau explicatif 1). Au cours de l’exercice 2004-2005, l’Institut canadien d’information sur la santé (ICIS) a adopté la variable « type d’établissement analytique » (par exemple, soins de courte durée, soins de longue durée, réadaptation) qui est attribuée à chaque enregistrement de radiation. La BDCP ne comporte pas d’identificateur au niveau de la personne, mais saisit le NAM et la province ou le territoire qui le délivreHIN.Note 10.Note 16.

Couplage Registre canadien du cancer–Base de données sur les congés des patients

Afin d’identifier les tumeurs ayant un potentiel de couplage, la variable NAM du RCC a été évaluée, du point de vue de sa présence et de sa conformité aux caractéristiques de base du NAM (longueur, format alphanumérique, motifs intégrés, caractère de vérification). Dans le cas des provinces comportant un pourcentage élevé de NAM dans le RCC qui satisfaisaient les critères de base de vérification (NAM « valides »), un couplage déterministe avec la BDCP a été effectué sur la base du NAM et de la province déclarant la tumeur. La province déclarant la tumeur a servi de variable de substitution pour la province délivrant le NAM.

Dans le cas des provinces comportant un faible pourcentage de NAM valides dans le RCC, et pour lesquelles Statistique Canada avait accès au registre provincial d’assurance-maladie (Ontario et Manitoba), un couplage en deux étapes a été effectué. On a utilisé le nom, le sexe, la date de naissance et le code postal du lieu de résidence pour coupler de façon probabiliste les enregistrements du RCC et les registres provinciaux d’assurance-maladie, afin d’obtenir les NAM. Le NAM et la province déclarant la tumeur ont par la suite servi à coupler de façon déterministe le RCC et la BDCP. Étant donné que les tumeurs sont reliées à des personnes du RCC, il a été possible d’associer chaque tumeur à l’ensemble des enregistrements couplés de la BDCP pour une personne.

Seuls les couplages effectués pendant les périodes de suivi pertinentes au niveau clinique ont été pris en compte. Les taux de couplage pour les tumeurs non invasives n’ont pas été examinés. Dans le cas des cancers colorectaux, du poumon et du sein chez la femme, la période de suivi s’étendait de 31 jours avant à 365 jours après la date de diagnostic du RCC; dans le cas du cancer de la prostate, la période de suivi s’étendait de 31 jours avant à 730 jours après la date de diagnostic. Pour être retenue comme enregistrement couplé, la date d’admission à l’hôpital dans la BDCP devait se situer dans la période de suivi.

On a utilisé les exercices 2004-2005 à 2010-2011 de la BDCP pour le couplage. Au cours de cette période, ni l’Alberta ni l’Ontario n’ont soumis de données sur des chirurgies d’un jour à la BDCPNote 16. Par ailleurs, au cours de l’exercice 2004-2005, deux établissements de la Nouvelle-Écosse n’ont pas soumis de données sur les chirurgies d’un jour à la BDCP; le nombre est passé à trois au cours de l’exercice 2005-2006 et à quatre au cours de l’exercice 2010-2011Note 16,Note 17. Les données sur les chirurgies d’un jour des établissements de l’Ontario, de l’Alberta et des quatre établissements de la Nouvelle-Écosse sont soumises au Système national d’information sur les soins ambulatoires (SNISA)Note 18.

Les tumeurs comportant un NAM valide dans le RCC ou un NAM obtenu grâce à un couplage probabiliste avec les registres provinciaux d’assurance-maladie ont été comparées avec les tumeurs ne comportant pas de NAM valide, selon le sexe, l’âge au moment du diagnostic, la confirmation microscopique et le comportement de la tumeur (non maligne/maligne). Les taux de couplage des tumeurs malignes/invasives comportant des NAM valides avec au moins un enregistrement de la BDCP pendant le suivi ont été examinés, selon le type d’établissement analytique, l’année civile du diagnostic, le sexe et le groupe d’âge au moment du diagnostic. Les cancers couplés à au moins un enregistrement de la BDCP ont été comparés avec les cancers ne pouvant être couplés du point de vue de la confirmation du diagnostic (histologie, cytologie, clinique/imagerie/inconnue, et autopsie seulement/certificat de décès seulement), ainsi que du nombre de jours en vie pendant le suivi. Comme le fichier de données utilisé pour cette étude comportait une confirmation de l’état civil complète en date du 31 décembre 2008, l’examen du nombre de jours en vie s’est limité aux enregistrements de cancer dont la date de fin de suivi était le 31 décembre 2008 ou avant.

Les tests statistiques pour les variables catégoriques étaient un test exact de Fisher et un test du khi-carré, et pour les variables continues, un test t exécuté sur deux échantillons (α = 0,05, bilatéral). Pour évaluer la validité des couplages, on a examiné la correspondance du sexe, de la date de naissance et du diagnostic, ainsi que les chiffres relatifs aux admissions à l’hôpital hors province.

Statistique Canada s’assure de protéger la confidentialité des données du répondant au cours du processus de couplage et de l’utilisation subséquente des fichiers de données couplées. Seuls les employés impliqués directement dans le processus de couplage ont accès aux identificateurs uniques requis pour le couplage (par exemple les noms et le numéro d’assurance-maladie) et ils n’ont pas accès à l’information qui à trait à la santé. Lorsque le processus de couplage est terminé, un fichier analytique de données est créé dans lequel tous les identificateurs personnels sont supprimés. L’accès à ce fichier libre d’identificateurs est réservé aux analystes aux fins de validation et d’analyses.

Résultats

Vérification de la validité du numéro d’assurance-maladie

La vérification du NAM a révélé que le couplage déterministe à partir des NAM dans le RCC ne serait pas possible pour l’Ontario et le Manitoba (tableau 1). Parmi les provinces qui restent, le pourcentage de NAM valides était de 99 % ou plus pour 2005 à 2008 (sauf pour Terre-Neuve-et-Labrador en 2007 et 2008  [98,4 % et 95,1 %, respectivement]; presque tous les NAM « invalides » étaient en fait manquants).

Pour l’Ontario et le Manitoba, 97,9 % et 95,8 % des tumeurs ont été couplées de façon probabiliste à un NAM dans les registres d’assurance-maladie respectifs (tableau 2). Pour la période de 2005 à 2008, le pourcentage de tumeurs comportant un NAM valide dépassait 98 % dans les deux provinces. Parmi les tumeurs couplées de façon probabiliste, la correspondance du sexe entre le RCC et le registre provincial d’assurance-maladie était de 99,9 % pour l’Ontario et de 100,0 % pour le Manitoba; la correspondance pour la date de naissance complète était de 98,7 % pour l’Ontario et de 71,9 % pour le Manitoba. La correspondance pour la date de naissance au Manitoba est passée de 51,1 % en 1992 à 93,6 % en 2008. L’examen des écarts notés au Manitoba a révélé que le premier jour du mois figurait de façon disproportionnée dans les dates de naissance du registre de la santé.

Plusieurs différences ont émergé entre les tumeurs comportant et ne comportant pas de NAM valide. Les tumeurs comportant un NAM valide étaient plus susceptibles d’être diagnostiquées chez des hommes (50,3 % comparativement à 46,1 %, p < 0,0001), d’être malignes (92,9 % comparativement à 83,7 %, p < 0,0001), et d’être confirmées par un examen microscopique (85,7 % comparativement à 74,6 %, p < 0,0001). Parmi les tumeurs invasives, celles comportant un NAM valide étaient plus susceptibles d’être confirmées par un examen microscopique (85,4 % comparativement à 70,2 %, p < 0,0001).

Taux de couplage RCCBDCP pendant le suivi

Le cancer de la prostate avait le taux de couplage le plus faible avec la BDCP. Pour les provinces soumettant des données sur les chirurgies d’un jour à la BDCP, le pourcentage de cancers de la prostate couplés à au moins un enregistrement de la BDCP allait de 77,2 % à 91,6 % (tableau 3). Lorsque l’analyse était limitée aux enregistrements de la BDCP soumis par les établissements de soins de courte durée, le pourcentage de couplage était plus faible, allant de 58,1 % à 65,4 %. Les taux de couplage avaient tendance à diminuer au fur et à mesure qu’avançait l’âge au moment du diagnostic, jusqu’à 80 ans, puis à augmenter (tableau 4). La méthode de confirmation du diagnostic ne différait pas de façon substantielle entre les cancers de la prostate couplés et non couplés (tableau 5). Le nombre moyen de jours en vie pendant le suivi était plus élevé dans les faits pour les cancers de la prostate non couplés à la BDCP (741,2 comparativement à 716,1 jours, p < 0,0001).

Les taux de couplage du cancer du sein chez la femme variaient selon le type d’établissement analytique, l’année civile et l’âge au moment du diagnostic. Parmi les provinces soumettant des données sur les chirurgies d’un jour à la BDCP, le pourcentage de cancers du sein chez la femme couplés à au moins un enregistrement de la BDCP allait de 95,6 % à 98,1 %. Lorsque l’analyse était limitée aux enregistrements de la BDCP soumis par des établissements de soins de courte durée, le pourcentage de couplage variait considérablement, allant de 56,8 % à 93,2 % (tableau 3). Dans le cas des provinces dont les données sur les soins de courte durée et les chirurgies d’un jour figuraient dans la BDCP, les taux de couplage globaux du cancer du sein demeuraient relativement stables au fil du temps, mais le taux de couplage avec les enregistrements d’hôpitaux de soins de courte durée diminuait, ce qui laisse supposer un changement de procédures au profit des chirurgies d’un jour (données non présentées). Mis à part l’Ontario, les taux de couplage avaient tendance à être plus faibles chez les 80 ans et plus (tableau 4). En comparaison avec les cancers du sein non couplés à un enregistrement de la BDCP, ceux qui étaient couplés étaient plus susceptibles d’avoir reçu une confirmation histologique (98,3 % comparativement à 93,3 %, p < 0,0001); le nombre moyen de jours en vie pendant le suivi était presque le même (383,9 comparativement à 385,1 jours, p = 0,0626) (tableau 5).

Les taux de couplage du cancer colorectal variaient peu selon le type d’établissement analytique, l’année civile, le sexe et l’âge au moment du diagnostic. En comparaison avec les cancers colorectaux non couplés à un enregistrement de la BDCP, ceux qui étaient couplés étaient plus susceptibles d’être confirmés au niveau histologique (95,2 % comparativement à 74,2 %, p < 0,0001) et comptaient un plus grand nombre de jours en vie pendant le suivi (345,2 comparativement à 294,8, p < 0,0001) (tableau 5). La différence dans le nombre moyen de jours en vie était attribuable au pourcentage élevé de cas d’autopsie seulement/de certificat de décès seulement parmi les cancers colorectaux non couplés; pour toutes les autres catégories de confirmation de diagnostic, le nombre moyen de jours en vie était plus élevé pour les cancers colorectaux non couplés (données non présentées). Dans le RCC, la date de décès et la date de diagnostic sont les mêmes pour les cas d’autopsie seulement/de certificat de décès seulement, ce qui limite à 31 le nombre de jours en vie pendant le suivi.

Les taux de couplage du cancer du poumon variaient selon le type d’établissement analytique et l’âge au moment du diagnostic. Parmi les provinces soumettant des données sur les chirurgies d’un jour à la BDCP, le pourcentage de cancers du poumon couplés à au moins un enregistrement de la BDCP allait de 92,8 % à 96,3 %. Lorsque l’analyse était limitée aux enregistrements des établissements de soins de courte durée, le pourcentage de couplage allait de 81,8 % à 91,4 % (tableau 3). Les taux de couplage avaient tendance à diminuer dans le groupe le plus âgé (tableau 4). En comparaison avec les cancers du poumon non couplés à un enregistrement de la BDCP, ceux qui étaient couplés étaient plus susceptibles d’être confirmés au niveau histologique (62,9 % comparativement à 45,3 %, p < 0,0001) et comptaient un moins grand nombre de jours en vie pendant le suivi (239,0 comparativement à 264,4, p < 0,0001), même s’ils comportaient un pourcentage plus faible de cas d’autopsie seulement/de certificat de décès seulement (tableau 5). Le nombre moyen de jours en vie pour les cancers du poumon non couplés dépassait de façon significative la moyenne pour les cancers couplés dans chaque catégorie de confirmation de diagnostic, sauf autopsie seulement/certificat de décès seulement, tandis que le nombre moyen de jours en vie était égal, à 31 (données non présentées).

Validité des enregistrements couplés

Plus de 99 % des enregistrements de la BDCP couplés à des cancers correspondaient au sexe du patient déclaré dans le RCC, et mis à part deux estimations pour l’Île-du-Prince-Édouard, plus de 97 % correspondaient à la date de naissance complète dans le RCC (tableau 6). Dans le cas de l’Île-du-Prince-Édouard, les 42 écarts pour le cancer de la prostate concernaient 16 personnes, et les 47 écarts pour le cancer du poumon, 19 personnes. Des différences d’un jour et d’une année, et des transpositions de mois et de jour, représentaient des écarts courants.

Généralement, les cancers de la prostate étaient les plus susceptibles, et les cancers du sein chez la femme les moins susceptibles d’être couplés à une admission à l’hôpital à l’extérieur de la province. Pour tous les cancers, l’Île-du-Prince-Édouard affichait le pourcentage le plus élevé de couplages avec au moins une admission à l’hôpital à l’extérieur de la province; l’Ontario affichait le plus faible (tableau 7).

La probabilité de couplage d’un enregistrement du RCC avec au moins un enregistrement de la BDCP comportant un diagnostic uniforme variait selon le cancer (tableau 7). Les cancers de la prostate étaient les moins susceptibles (77,4 % à 87,8 %) et les cancers colorectaux les plus susceptibles (94,6 % à 97,7 %) d’être couplés à au moins un enregistrement de la BDCP comportant un diagnostic de cancer uniforme.

Discussion

Le couplage déterministe avec la BDCP est possible pour 8 des 10 provinces du RCC, parce qu’un pourcentage élevé de tumeurs enregistrées comportent un NAM valide. Dans le cas de l’Ontario et du Manitoba, les couplages directs à partir des NAM ne sont pas possibles, mais un couplage probabiliste avec les NAM obtenus des registres provinciaux d’assurance-maladie ont permis d’obtenir des NAM pour plus de 98 % des tumeurs dans le RCC de 2005 à la fin de 2008, ce qui a rendu possible le couplage déterministe avec la BDCP. Néanmoins, étant donné que cette étude a examiné la validité des NAM dans le RCC, les résultats pour l’Ontario et le Manitoba ne devraient pas être interprétés comme correspondant à la validité des NAM dans les registres du cancer respectifs.

La correspondance pour le sexe et la date de naissance parmi les enregistrements couplés du RCC et de la BDCP et les tendances dans les résultats assurent la validité conceptuelle des couplages déterministes à partir du NAM.

Tout d’abord, les cancers pour lesquels la chirurgie est le traitement privilégié (cancer du sein chez la femme, cancer colorectal et cancer du poumon)Note 18 avaient des taux de couplage élevés et étaient les plus susceptibles de comporter un diagnostic de cancer uniforme avec le RCC pour au moins un enregistrement couplé de la BDCP. En revanche, malgré une période de suivi deux fois plus longue, le taux de couplage le plus faible était pour le cancer de la prostate, dont le traitement optimal fait l’objet de discussions, qui tiennent compte de l’espérance de vie au moment du diagnostic, de la probabilité que le cancer cause des problèmes, et des effets secondaires du traitementNote 19. Les cancers de la prostate étaient les moins susceptibles de comporter un diagnostic de cancer uniforme dans au moins un enregistrement couplé de la BDCP.

En deuxième lieu, l’Ontario, qui est la province comportant le taux de couplage global le plus faible pour le cancer du sein chez la femme, est aussi celle où l’on est le plus susceptible de pratiquer des mastectomies comme chirurgies d’un jour, dont les données ne sont pas soumises à la BDCPNote 20.

Enfin, le pourcentage de cancers couplés avec au moins une admission à l’hôpital à l’extérieur de la province variait selon le type de cancer et la population de la province, ce qui laisse supposer que certains traitements ne sont pas offerts à proximité dans certaines provinces.

Limites

Les principales limites de cette recherche sont les différences entre les provinces quant aux enregistrements soumis à la BDCP et les modèles de pratique clinique différents à l’égard des patients hospitalisés, en chirurgie d’un jour ou externes. Comme avec le cancer du sein chez la femme, même lorsque les établissements de soins de courte durée sont le seul type d’établissement pris en compte, les taux de couplage varient de façon substantielle. Parmi les autres limites figure l’exclusion du couplage du QuébecNote 11 et des territoires.

Mot de la fin

Les NAM personnels peuvent être utilisés pour coupler le RCC et la BDCP, afin d’obtenir des données sur les hospitalisations des personnes ayant un cancer primaire. Les variations provinciales dans les taux de couplage des quatre cancers les plus couramment diagnostiqués rendent compte des différences dans les enregistrements soumis à la BDCP et dans la pratique clinique. Parmi les enregistrements couplés, la correspondance était élevée pour les identificateurs de base. Au fur et à mesure qu’un plus grand nombre d’interventions sont effectuées sous forme de chirurgies d’un jour/pour patients externes et qu’un plus grand nombre de provinces et territoires soumettent ce type d’enregistrements au SNISA, la combinaison de données provenant de sources multiples (par exemple, BDCP, SNISA, bases de données sur la facturation par les médecins) sera importante pour l’étude des expériences en soins de santé des personnes atteintes d’un cancer. Enfin, si des données concernant la date de décès ou la méthode de confirmation du diagnostic sont disponibles, les chercheurs pourraient envisager le rajustement de la période de suivi pour les cancers diagnostiqués au moment du décès à une année avant la date de diagnostic (date de décès), afin d’augmenter le potentiel de couplage.

Date de modification :