Rapports sur la santé
Les données d’enquêtes internationales sur la santé de la population couplées aux données sur les résultats : une nouvelle ressource pour la santé publique et l’épidémiologie

par Stacey Fisher, Carol Bennett, Deirdre Hennessy, Tony Robertson, Alastair Leyland, Monica Taljaard, Claudia Sanmartin, Prabhat Jha, John Frank, Jack V. Tu, Laura C. Rosella, JianLi Wang, Christopher Tait et Douglas G. Manuel

Date de diffusion : le 29 juillet 2020

DOI : https://www.doi.org/10.25318/82-003-x202000700002-fra

Au Canada et à l’étranger, on a de plus en plus recours au couplage de données d’enquêtes nationales sur la santé de la population aux statistiques de l’état civil et à des données sur les soins de santé, ce qui permet de rassembler de grandes quantités de données de qualité représentatives à l’échelle nationale sur les facteurs de risque liés à la santé et de les combiner avec les résultats en matière de santé à l’échelle de la personneNote 1Note 2Note 3Note 4Note 5. Les enquêtes sur la santé menées au Canada et aux États-Unis, à elles seules, ont permis de recueillir des données sociodémographiques détaillées et des données sur les comportements influant sur la santé auprès de plus de 1 million de répondants depuis 1997, données qui ont été associées à plus de 6 millions de personnes-années de suivi de la mortalitéNote 1Note 6. Comme les enquêtes nationales sur la santé ont souvent des objectifs de surveillance et des conceptions semblables, le regroupement de données d’enquêtes sur la santé de la population couplées pourrait permettre de créer une nouvelle ressource pour la surveillance de la santé et la recherche en santé, tout en offrant une perspective internationale et démographique beaucoup plus vaste.

Enquêtes nationales sur la santé de la population par rapport aux études épidémiologiques traditionnelles

Les enquêtes nationales sur la santé de la population permettent de recueillir un large éventail de données sur l’état de santé, les comportements influant sur la santé et les caractéristiques sociodémographiques auprès d’un échantillon représentatif de la population à domicile d’un pays. Ces enquêtes sont l’une des pierres angulaires de la surveillance de la santé de la population (tableau 1) et s’inscrivent dans une perspective démographique : elles reposent sur une approche d’échantillonnage qui est conçue pour produire un échantillon représentatif de la population (en ce qui a trait aux caractéristiques sociodémographiques). Cet échantillon est utilisé pour estimer la prévalence de problèmes de santé et de facteurs de risque au sein de la population. Il est aussi utilisé pour surveiller les tendances démographiques, pour guider l’élaboration, la mise en œuvre et l’évaluation des politiques, pour éclairer la prise de décisions sur l’affectation des ressources en santé et pour évaluer les progrès réalisés vers l’atteinte des objectifs nationaux en matière de santé.

Les enquêtes nationales sur la santé de la population sont généralement menées à intervalles réguliers (souvent chaque année) pour dresser des portraits actuels de la santé de la population. En revanche, les études épidémiologiques traditionnelles, c’est-à-dire les études qui sont fondées sur des conventions enseignées dans la plupart des cours d’introduction à l’épidémiologie pour examiner une relation exposition-résultat précise, sont généralement axées sur l’étiologie et reposent souvent sur l’échantillonnage de commodité.

Les enquêtes sur la santé de la population ne permettent habituellement pas de recueillir des données longitudinales sur les répondants à l’enquête, contrairement à la plupart des études épidémiologiques traditionnelles, lesquelles visent en général à déterminer activement les résultats et comportent souvent une évaluation de l’exposition répétée pendant une période de suivi. Généralement, les enquêtes sur la santé de la population permettent seulement de déterminer des niveaux d’exposition de référence, par l’autodéclaration, et la plupart des enquêtes ne permettent pas d’établir des résultats temporels en raison de leur nature transversale. Cependant, le couplage de données d’enquêtes sur la santé à des données sur les résultats, comme les statistiques de l’état civil et les données sur les soins de santé, adopte une perspective longitudinale qui accroît considérablement l’utilité des enquêtes.

En plus de permettre la surveillance de la santé de la population, les enquêtes nationales sur la santé sont utilisées pour la recherche sur la santé de la population, car elles permettent de recueillir des données qui ne figurent pas dans les fichiers administratifs sur la santé (p. ex. les comportements influant sur la santé). Ces données sont utilisées par les chercheurs pour étudier les relations entre les déterminants sociaux et les résultats en matière de santé, pour évaluer le fardeau associé à la maladie et aux facteurs de risque et pour étudier le rôle que joue la modification des facteurs de risque dans la prévention. Ces données sont également utilisées pour évaluer le rendement du système de soins de santé dans les différents groupes sociodémographiques et économiques et dans différents groupes présentant des degrés divers de maladie. Les données servent aussi à orienter l’élaboration des politiques en matière de santé. Les enquêtes nationales sur la santé sont indispensables pour comprendre, surveiller et améliorer la santé de la population.

Regroupement à l’échelle de la personne d’enquêtes nationales sur la santé de la population

Les méta-analyses sont utilisées depuis longtemps pour résumer des recueils d’études épidémiologiques traditionnelles, ce qui offre une puissance statistique accrue et permet de produire des estimations plus précises des effets. Le regroupement à l’échelle de la personne de données d’enquêtes sur la santé de la population couplées peut conférer des avantages semblables à l’égard des questions de santé de la population et pourrait permettre de créer une nouvelle ressource précieuse pour la planification contemporaine liée à la santé de la population, y compris l’utilisation d’algorithmes permettant l’analyse multivariée des risques à l’échelle de la personneNote 7Note 8Note 9Note 10Note 11 et de la microsimulationNote 12Note 13 pour prévoir le fardeau de la maladie et évaluer des stratégies de réduction des risques.

Méta-analyse d’études épidémiologiques traditionnelles

La méta-analyse est une procédure statistique utilisée pour résumer les résultats de plusieurs essais cliniques ou d’études d’observation autonomes portant sur une association exposition-résultat précise.

Le principal intérêt de la méta-analyse est qu’elle consiste à agréger les données de toutes les études pertinentes, ce qui produit un résumé quantitatif d’une série de travaux de recherche présentant une plus grande puissance statistique et permettant de produire des estimations plus précises des effets que chacune des études prise isolément. On peut utiliser la méta-analyse pour rapprocher les résultats incohérents d’études précédentes et pour étudier des maladies rares et des facteurs de risque inhabituels ou faibles qui n’ont pas pu être examinés dans le cadre d’études individuellesNote 14Note 15Note 16.

Les méta-analyses offrent également la possibilité d’apporter un nouvel éclairage par l’exploration de l’hétérogénéité statistique. Il y a hétérogénéité statistique dans une méta-analyse lorsque la variation d’échantillonnage ne peut expliquer les différences au chapitre de l’estimation des effets d’intérêt dans les différentes études. Cela peut être attribuable aux différences dans la conception des études, les méthodes statistiques utilisées ou la qualité des études, ce qui entraîne une hétérogénéité méthodologique, ou aux différences dans la définition de l’exposition ou des résultats ou dans les caractéristiques de la population, ce qui entraîne une hétérogénéité cliniqueNote 17. Dans toutes les méta-analyses, il importe d’établir la présence ou l’absenced’hétérogénéité, car l’agrégation des études comportant des résultats incohérents peut donner lieu à des conclusions inexactes ou erronéesNote 17Note 18Note 19Note 20Note 21. Cependant, l’hétérogénéité peut aussi représenter « notre plus grande alliée »Note 20, car l’examen de ses causes peut mener à des résultats scientifiques et cliniques appréciablesNote 17Note 21.

Les méta-analyses des données individuelles des patients (DIP) consistent à regrouper et à analyser de nouveau les données brutes issues des études admissiblesNote 22. Ces méta-analyses sont considérées comme la norme de référence des examens systématiquesNote 23. Le regroupement et la nouvelle analyse permettent la normalisation des critères d’inclusion et d’exclusion des participants, la définition de variables, la correction en tenant compte des facteurs confusionnels et la modélisation. Il en résulte des estimations plus précises des effets globauxNote 24, et il est ainsi plus facile d’examiner l’influence des caractéristiques à l’échelle des participants sur l’estimation des effets et de relever des sous-groupes pour lesquels les associations avec les facteurs de risque peuvent varier. Malgré les avantages considérables qu’elles présentent par rapport aux méta-analyses sans données à l’échelle de la personne, les méta-analyses des DIP ne sont pas réalisées souvent, car elles exigent beaucoup de coopération et d’organisation, le partage des données et une grande expertise statistiqueNote 24Note 25.

Application aux enquêtes nationales sur la santé de la population

L’agrégation de données d’enquêtes internationales sur la santé couplées permet de créer une ressource précieuse pour la planification contemporaine liée à la santé de la population et la recherche en santé. Le regroupement et l’analyse des données à l’échelle des personnes d’enquêtes nationales sur la santé de la population à l’aide de méthodes comme la méta-analyse des DIP pourraient permettre de produire des estimations plus précises des effets avec moins d’incertitude statistique. De plus, l’examen de l’hétérogénéité à l’échelle des enquêtes et des sous-groupes pourrait apporter un nouvel éclairage. L’agrégation des données d’enquêtes pourrait donner lieu à de meilleures comparaisons des risques de maladie, du fardeau de la maladie et des tendances à l’échelle internationale; elle pourrait aussi faciliter les analyses de l’équité et appuyer les politiques en matière de santé et l’établissement des priorités.

Le présent document a pour objectif d’examiner la faisabilité du regroupement de données d’enquêtes sur la santé de la population couplées provenant de trois pays, de faciliter l’examen des comportements influant sur la santé et de présenter des renseignements utiles pour la planification de la surveillance internationale de la santé de la population et les travaux de recherche connexes. Des comparaisons détaillées de la conception, des méthodes et du contenu des enquêtes nationales sur la santé du Canada, des États-Unis et de l’Écosse ont été réalisées. Des variables communes ont été établies et les chiffres liés à la taille des échantillons et aux résultats des estimations sont fournis.

Méthodes

La comparabilité de la conception de l’Enquête sur la santé dans les collectivités canadiennes (ESCC) (cycles 2.1 [2003], 3.1 [2005] et 4.1 [2007], et ESCC de 2008)Note 26, de la National Health Interview Survey (NHIS) des États-Unis (2000 et 2005)Note 27Note 28 et de la Scottish Health Survey (SHeS) (2003, 2008 à 2010)Note 29Note 30Note 31Note 32 a été examinée. Pour ce faire, il a fallu évaluer le contenu des enquêtes, les populations cibles et les exclusions, les méthodes d’échantillonnage et d’administration, la taille des échantillons et les taux de réponse ainsi que les couplages. L’année d’enquête, l’inclusion de sujets d’intérêt liés aux comportements influant sur la santé (p. ex. la NHIS permet de recueillir des données détaillées sur l’alimentation tous les cinq ans) et la disponibilité d’un couplage aux données sur la mortalité ont été prises en considération dans la sélection des cycles d’enquête pertinents.

Des questions sur l’usage du tabac, la consommation d’alcool, l’activité physique et l’alimentation ont été déterminées; la formulation des questions ainsi que les catégories et la structure des réponses ont été comparées. L’accent a été mis sur les comportements influant sur la santé, car ces derniers constituent d’importants facteurs de risque liés à la santé qui sont recueillis dans pratiquement toutes les enquêtes sur la santé et qu’ils sont conceptuellement complexes et sont observés à l’aide de différentes approches. Il a fallu évaluer la comparabilité des concepts liés aux comportements influant sur la santé et utiliser les variables existantes pour créer de nouvelles variables communes. Les variables communes ont été établies pour obtenir le niveau de détail le plus élevé possible dans toutes les enquêtes; elles ont été évaluées par trois examinateurs et ont fait l’objet de discussions.

Des fichiers de données à grande diffusion ont été utilisés pour obtenir des estimations de la taille des échantillons selon le sexe des répondants aux enquêtes âgés de 20 ans et plus des trois pays à l’étude. Les estimations pour l’ESCC ont été obtenues grâce à la collaboration de Statistique Canada. Les données à grande diffusion de la NHIS ont été téléchargées à partir du site Web des (Centres pour le contrôle et la prévention des maladies (CDC) www.cdc.gov). Les données à grande diffusion de la SHeS ont été obtenues sur le site Web du Service de données du Royaume-Uni (www.ukdataservice.ac.uk).

Les estimations de la mortalité pour l’ESCC ont été obtenues grâce à la collaboration de Statistique Canada. Les estimations de la mortalité pour la NHIS ont été tirées des fichiers de données à grande diffusion de la NHIS couplés au National Death Index, lequel peut aussi être téléchargé à partir du site Web des CDC. Les estimations de la mortalité pour la SHeS ont été obtenues grâce à la collaboration de la Division des services d’information de l’Écosse. Les données de suivi de la mortalité pour l’ESCC et la NHIS allaient jusqu’au 31 décembre 2011, tandis que les données de suivi pour la SHeS allaient jusqu’au 31 décembre 2014. L’approbation de l’étude sur le plan éthique a été obtenue du Conseil d’éthique de la recherche du Réseau de science de la santé d’Ottawa.

Résultats

Comparabilité des enquêtes

L’ESCC, la NHIS et la SHeS sont des enquêtes transversales auprès des ménages financées par le gouvernement et conçues pour appuyer les efforts de surveillance nationale de la santé au Canada, aux États-Unis et en Écosse, respectivementNote 2Note 6Note 26. L’ESCC a été menée tous les deux ans, de 2001 à 2007, et est menée chaque année depuis 2008. La NHIS est réalisée chaque année depuis 1957. La SHeS a été menée en 1995, en 1998 et en 2003, et elle est réalisée chaque année depuis 2008. Un résumé des résultats de l’analyse de comparabilité est présenté au tableau 2.

Contenu

Les questionnaires principaux permettent de recueillir des données sur les caractéristiques sociodémographiques, l’état de santé, les services de santé et les déterminants de la santé. Des données sur d’autres sujets d’intérêt liés à la santé sont recueillies dans des modules de réponse rapide (ESCC), des suppléments d’enquête (NHIS) et un module biennal utilisé en alternance (SHeS). La SHeS permet aussi de recueillir des mesures anthropométriques et des échantillons de sang, de salive et d’urine auprès d’un sous-échantillon de répondants à l’enquête.

Populations cibles et exclusions

L’ESCC, la NHIS et la SHeS ont des populations cibles comparables qui incluent la population nationale ne vivant pas en établissement et excluent les membres actifs des forces armées, les personnes en prison et dans les établissements de soins de longue durée et les personnes qui vivent dans certaines régions éloignées (ESCC et SHeS) ou à l’étranger (NHIS). L’ESCC exclut également les personnes vivant dans les réserves. L’ESCC permet de recueillir des données uniquement auprès des personnes âgées de 12 ans et plus, tandis que la NHIS et la SHeS permettent toutes deux de recueillir des données sur toutes les personnes, peu importe leur âge.

Méthodes d’échantillonnage

Bien que les populations des pays varient (le Canada compte 37,6 millions de résidents, les États-Unis comptent 329 millions de résidents et l’Écosse compte 5,3 millions de résidents), des méthodes d’échantillonnage aréolaire à plusieurs degrés semblables, conçues pour produire des données annuelles à l’échelle nationale, sont utilisées pour l’ESCC, la NHIS et la SHeS. L’ESCC permet aussi de produire des estimations annuelles à l’échelle des provinces, des territoires et de 110 régions sociosanitaires. La SHeS permet de produire des données à l’échelle des conseils de santé tous les quatre ans. La taille de l’échantillon de la NHIS n’est pas suffisamment grande pour fournir des données à l’échelle des États avec une précision acceptable, mais on peut évaluer les données de plusieurs années d’enquête pour produire des estimations.

Pour l’ESCC, l’échantillonnage a été réalisé en répartissant la taille de l’échantillon annuel entre les provinces et les territoires selon la taille de leur population et le nombre de leurs régions sociosanitaires, puis en répartissant de nouveau l’échantillon entre les régions sociosanitaires. La base de sondage de la NHIS pour les enquêtes de 2000 et de 2005 comptait 358 unités primaires d’échantillonnage (à l’intérieur desquelles deux autres unités d’échantillonnage ont été utilisées) et comportait un suréchantillonnage des Noirs et des Hispaniques. Pour la SHeS, les échantillons de chaque année ont été regroupés, et l’échantillon de quatre ans a été stratifié. En 2008, 25 strates de défavorisation des régions ont été utilisées dans la SHeS afin de produire des estimations à l’échelle des conseils de santé, ce qui a permis d’obtenir un suréchantillon de régions défavorisées. Des poids d’échantillonnage ont été utilisés dans toutes les enquêtes pour tenir compte des probabilités de sélection et du biais de non-réponse.

Méthodes d’administration

Toutes les enquêtes ont eu recours à des interviews sur place assistées par ordinateur réalisées par des intervieweurs d’expérience. Environ la moitié des interviews de l’ESCC ont été des interviews téléphoniques assistées par ordinateur.

Taille des échantillons et taux de réponse

L’ESCC a été menée auprès de 130 000 répondants tous les deux ans lorsqu’elle a été lancée en 2001. Depuis 2007, elle est menée chaque année auprès de 65 000 répondants. Le taux de réponse total des adultes a été de 81 % en 2003 et de 76 % en 2008. La NHIS est menée chaque année auprès d’environ 30 000 répondants adultes depuis 1997. Les taux de réponse d’un échantillon inconditionnel d’adultes ont été de 72 % en 2000 et de 69 % en 2005Note 27Note 28. La SHeS repose sur un échantillon beaucoup plus petit que l’ESCC et la NHIS. Jusqu’en 2011, on a interrogé environ 7 000 adultes dans le cadre de la SHeS. Depuis 2011, environ 4 500 répondants adultes sont interrogés chaque année. De 2003 à 2010, les taux de réponse chez les adultes admissibles étaient compris entre 55 % et 60 %Note 29Note 30Note 31Note 32.

Couplages disponibles

Les données de l’ESCC ont été couplées aux statistiques de l’état civil jusqu’au 31 décembre 2011 et aux registres des sorties des hôpitaux, et d’autres couplages de données sont prévus1. L’accès à ces données est restreint à Statistique Canada et aux centres de données de recherche de Statistique Canada. Les données de la NHIS ont été couplées au National Death Index et ont fait l’objet d’un suivi jusqu’au 31 décembre 2011. On peut obtenir des renseignements sur l’accès aux fichiers de données à grande diffusion, aux fichiers de données sur la faisabilité et aux données à accès restreint auprès des CDC (www.cdc.gov). La SHeS a été couplée à des bases de données administratives sur la mortalité et la santé, y compris les hospitalisations2, et un suivi de la mortalité a été fait jusqu’au 31 décembre 2014. On peut demander d’avoir accès à ces données en communiquant avec le Public Benefit and Privacy Panel for Health and Social Care (www.informationgovernance.scot.nhs.uk).

Formulation des questions, catégories et structure des réponses

Des variables communes ont été créées pour mesurer l’usage du tabac, la consommation d’alcool, l’activité physique et l’alimentation dans les trois enquêtes (tableau 3). Les variables communes pour l’usage du tabac et l’activité physique sont comparables entre l’ESCC, la NHIS et la SHeS. Les variables communes pour la consommation d’alcool et de fruits et de légumes sont comparables entre l’ESCC et la NHIS. Cependant, la SHeS permet de recueillir et de déclarer des données sur la consommation d’alcool et l’alimentation à l’aide de mesures normalisées et plus détaillées. Par conséquent, il faut faire preuve de prudence lorsque l’on compare les données sur la consommation d’alcool et l’alimentation de la SHeS et celles des deux autres enquêtes. Dans la SHeS, la consommation d’alcool est déclarée au moyen d’unités d’alcool. Cette mesure n’est pas directement comparable avec celles de l’ESCC et de la NHIS, dans lesquelles on utilise le « nombre de verres », une mesure plus subjective. De même, la SHeS permet de recueillir des données détaillées sur la consommation de fruits et de légumes, y compris la quantité consommée, tandis que l’ESCC et la NHIS permettent seulement de recueillir des données sur la fréquence de consommation. On peut consulter en ligne au https://osf.io/4rczm/ des descriptions détaillées de l’influence qu’ont eue les ressemblances et les différences entre les enquêtes sur la création des variables communes et de l’incidence que peuvent avoir ces différences sur leur interprétation.

Estimations de la taille des échantillons issus du couplage aux données sur la mortalité

Environ 87 %, 94 % et 83 % des répondants à l’ESCC, à la NHIS et à la SHeS, respectivement, ayant consenti au partage et au couplage de leurs données ont été couplés avec succès aux données nationales sur la mortalité (tableau 4). Au sein des répondants couplés avec succès, 19 227 décès sont survenus chez les répondants à l’ESCC pendant la période de suivi de la mortalité de 1,8 million de personnes-années. Chez les répondants à la NHIS, 6 341 décès sont survenus pendant la période de suivi de près d’un demi-million de personnes-années. Chez les répondants à la SHeS, 2 856 décès sont survenus pendant la période de suivi de 160 000 personnes-années.

Discussion

Les enquêtes nationales sur la santé de la population représentent les plus grandes cohortes de population et permettent de recueillir des données sur l’état de santé, les comportements influant sur la santé, les caractéristiques sociodémographiques, l’utilisation des soins de santé et des mesures de la qualité de vie liées à la santé. Compte tenu des objectifs généraux de ces enquêtes, les données qui y sont recueillies peuvent être utilisées à de nombreuses fins, surtout lorsqu’elles sont couplées aux données sur les résultats en matière de santé. Le regroupement de données d’enquête sur la santé couplées pourrait permettre de créer une nouvelle ressource pour la recherche sur la santé de la population.

Le regroupement de données d’enquêtes sur la santé de la population couplées à l’échelle de la personne dans les différents secteurs de compétence présente deux grands avantages. En premier lieu, des données combinées offrent un échantillon plus vaste et une plus grande puissance statistique, ce qui permet de produire des estimations plus précises des effets. Cela permet de mener d’autres analyses par sous-groupe et des examens plus détaillés des effets médiateurs et des effets d’interaction. L’augmentation de la taille de l’échantillon permet aussi de mieux examiner des facteurs de risque inhabituels ou faibles et des résultats inhabituels, comme le cancer et de nombreuses maladies chroniques. En second lieu, ces données pourraient accroître la généralisabilité des constatations des études. Les relations entre les expositions des enquêtes et les résultats couplés qui sont constants dans les différents secteurs de compétence sont potentiellement plus solides, comparativement aux relations incohérentes. L’examen des relations incohérentes peut également apporter de nouvelles connaissances, à l’instar de l’examen de l’hétérogénéité dans les méta-analyses. À titre d’exemple, on peut associer l’effet des comportements influant sur la santé sur le risque de mortalité à des différences à l’échelle des pays dans l’inégalité sociale et économique ou dans l’accès aux services de santéNote 33.

Un échantillon plus vaste et une généralisabilité accrue donnent lieu à de nombreuses possibilités de recherche et de surveillance. À titre d’exemple, la plupart des analyses internationales reposent sur les résultats agrégés de différentes sources, car on a du mal dans de nombreuses études à examiner des variables sociodémographiques et à aborder les effets médiateurs, l’interaction et le délai entre l’exposition et les résultatsNote 8Note 34. Étant donné que les enquêtes sur la santé comportent généralement des questions sociodémographiques concernant le niveau de scolarité, l’historique d’emploi, le revenu, l’appartenance ethnique et le statut d’immigrant, ces données sont toutes indiquées pour examiner les risques pour la santé sous l’angle de l’équité.

Des données d’enquêtes sur la santé combinées permettent aussi d’améliorer la capacité de surveiller la relation entre les expositions des enquêtes et les résultats. À titre d’exemple, on craint que la relation entre l’usage du tabac et les résultats en matière de santé ait changé au fil du temps, compte tenu des changements observés dans les tendances en matière d’usage du tabac et la composition des produits du tabac. Il est possible de mener une étude longitudinale internationale portant sur cette relation à l’aide de données d’enquêtes internationales sur la santé de la population couplées et regroupées.

En outre, des données d’enquêtes internationales sur la santé de la population couplées et regroupées pourraient servir à réaliser de meilleures comparaisons internationales des estimations du fardeau de la maladie. La déclaration du fardeau de la maladie exige des données sur la prévalence des facteurs de risque, des chiffres liés aux résultats et des estimations du risque relatif associé à l’exposition d’intérêt. Les estimations du fardeau de la maladie les plus récentes, notamment celles de l’étude sur la charge mondiale de morbiditéNote 35, reposent sur l’approche des données agrégées décrite pour la première fois par Levin (1978)Note 36. Grâce à cette méthode, on obtient des mesures agrégées de la prévalence des facteurs de risque et les chiffres liés aux résultats de sources indépendantes. On obtient la prévalence des facteurs de risque à partir d’enquêtes sur la santé de la population, on tire les chiffres liés aux résultats de sources de données de l’état civil et on obtient les estimations du risque relatif à partir d’études épidémiologiques indépendantes pour décrire l’association entre le facteur de risque et le résultat. Cependant, les données des enquêtes nationales sur la santé qui ont été couplées aux données sur les résultats peuvent être utilisées comme sources de données uniques dans le cadre de ces étudesNote 8, et le regroupement de ces données provenant de plusieurs pays permettrait d’adopter une méthode d’analyse normalisée.

Limites et défis

L’un des plus grands défis que pose le regroupement de données d’enquêtes sur la santé de la population couplées de différents pays est l’hétérogénéité engendrée par les différences entre les questions d’enquête. Il s’est avéré difficile et exigeant de créer des variables communes liées aux comportements influant sur la santé en utilisant les enquêtes du Canada, des États-Unis et de l’Écosse aux fins de de la présente étude. Par ailleurs, les variables créées étaient moins détaillées et n’étaient pas entièrement comparables d’une enquête à l’autre.

Au fil du temps, la détermination des facteurs de risque comportementaux est devenue plus uniforme dans les différents pays, et de plus en plus d’études de validation révèlent un biais de détermination acceptableNote 40. Cependant, une plus grande uniformité est nécessaire. À titre d’exemple, malgré les recommandations internationales qui sont suivies dans plus de 100 pays pour la détermination de l’usage du tabacNote 41, l’absence de données historiques sur l’usage du tabac dans la NHIS a fait en sorte qu’il n’a pas été possible de calculer des paquets-années, une mesure plus détaillée du comportement en matière d’usage du tabac que la mesure catégorielle du « statut de fumeur » qui a été créée dans la présente étude. Des changements apportés à l’ESCC ont aussi fait en sorte qu’il n’a pas été possible de faire la distinction entre les anciens buveurs et les non-buveurs au cycle 4.1. Dans l’étude, même si un concept était présent, la période pendant laquelle l’exposition a été déterminée variait souvent. En outre, certaines questions étaient facultatives selon la région géographique, et il y avait des différences dans la définition et la classification des variables.

Il est difficile de comparer les expositions dans plusieurs enquêtes sur la santé, et ces dernières évoluent constamment. Pour faciliter les choses, « cchsflow », une bibliothèque de source ouverte, a été élaborée à l’appui de l’harmonisation des variables de l’ESCC entre les cycles d’enquêteNote 37. Cette approche d’harmonisation des variables peut être appliquée à d’autres enquêtes internationales sur la santé de la population et peut être utilisée pour harmoniser les variables tant entre les cycles d’une même enquête qu’entre les enquêtes de différents pays. Les métadonnées des enquêtes appuient aussi l’harmonisation en améliorant le catalogage des enquêtes. Les métadonnées des enquêtes sont offertes dans le format de l’Initiative de documentation de données, une norme de métadonnées internationale à cet égardNote 38Note 39.

La diminution des taux de réponse constitue un autre défi. Si les participants à l’enquête sont systématiquement différents des personnes qui n’y participent pas, l’échantillon de l’enquête ne sera pas représentatif de la population cible, et des conclusions valables ne pourront être tirées. On reconnaît constamment que les non-répondants ont de mauvais comportements influant sur la santé et présentent une surmortalité comparativement aux répondantsNote 42Note 43Note 44Note 45. Le couplage de données peut être utilisé pour évaluer le biais de non-réponse et éventuellement y apporter des corrections. Gorman et al. (2014)Note 46 ont évalué l’importance du biais de non-réponse dans la SHeS en comparant les taux de mortalité toutes causes confondues et les dommages causés par l’alcool chez les répondants à l’enquête et la population en général. Ils ont constaté que les taux d’incidence étaient plus faibles chez les répondants à l’enquête, les ratios de taux de l’enquête à la population s’élevant à 0,69 pour les dommages causés par l’alcool et à 0,89 pour la mortalité toutes causes confondues. Ils ont conclu que les gros buveurs étaient moins susceptibles de répondre à la SHeS que les buveurs modérés ou les personnes qui boivent peu. Ce type de comparaison des répondants et des non-répondants peut guider les procédures de pondération et d’imputation afin d’apporter des corrections en fonction du biais de non-réponse.

Des approches de combinaison des cycles de l’enquête sur la santé de la population d’un pays unique ont été élaboréesNote 47, mais les approches de regroupement d’enquêtes de différents pays sont plus complexes, en raison des différences dans la conception de l’enquête de chaque pays. Il est possible de recourir à des méthodes et à des techniques méta-analytiques modifiées utilisées dans des études portant sur des cohortes épidémiologiques regroupées à l’échelle internationale, comme l’Enquête prospective européenne sur le cancer et la nutritionNote 48. Cependant, de nouvelles méthodes devront être établies. De plus, des différences dans les populations sous-jacentes des enquêtes peuvent aussi faire en sorte qu’il n’est pas possible de produire des estimations de l’effet regroupé d’un effet exposition-résultat d’intérêt. Cependant, ce ne sera pas le cas de tous les effets, et l’examen des sources de cette hétérogénéité pourrait aussi permettre d’apporter de nouvelles idées importantes.

Enfin, la plus grande limite pratique du regroupement de données d’enquêtes internationales sur la santé de la population couplées est l’accès aux données. L’accessibilité des données d’enquête sur la santé couplées aux résultats varie d’un pays à l’autre. À titre d’exemple, les données de la NHIS couplées aux données sur la mortalité sont accessibles au public sur le site Web des CDC. En revanche, l’accès aux données équivalentes au Canada, en Écosse et dans de nombreux autres pays est restreint. Cela étant dit, des données d’enquête sur la santé non couplées sont souvent accessibles au public, y compris les données de l’ESCC, qui font l’objet d’une licence ouverte de Statistique Canada. La NHIS a démontré qu’il est possible d’évaluer la façon d’intégrer des résultats couplés aux fichiers d’enquête à grande diffusion existants, tout en garantissant qu’il n’y a pas de risque accru de nouvelle identification et en veillant au respect des principes de partage des données existants.

La Stratégie de recherche axée sur le patient (www.cdp.hdrn.ca) a été élaborée pour aborder la question de l’accès aux données et appuyer les efforts d’harmonisation dans tout le Canada. On pourrait utiliser un modèle semblable pour faciliter les tâches analogues dans les études portant sur plusieurs pays, y compris le regroupement de données d’enquêtes sur la santé de la population couplées. Dans les réseaux comme le Réseau international de couplage de données sur la population (www.ipdln.org), on a discuté davantage de la réalisation d’études au moyen de données provenant de plusieurs pays et on a porté un intérêt accru à la poursuite de telles études. Les problèmes liés au partage des données entre les secteurs de compétence et de protection de la vie privée doivent être surmontés pour que les avantages des analyses d’enquêtes sur la santé regroupées se réalisent pleinement. Cela dépasse la portée du présent document.

Conclusion

L’utilisation de données d’enquêtes nationales sur la santé de la population regroupées et couplées aux résultats en matière de santé présente des possibilités énormes à des fins d’évaluation et de comparaisons internationales des risques pour la santé, d’analyse de l’équité, d’estimation du fardeau de la maladie et de surveillance permanente. Des méthodes novatrices devront être utilisées pour surmonter les défis que posent les différences entre les enquêtes, et l’adoption de normes internationales pour la collecte de mesures de base liées à la santé pourrait permettre d’améliorer ces méthodes. Les questions relatives aux restrictions touchant les données et à la protection de la vie privée des différents secteurs de compétence doivent être abordées et réglées.

Liste des abréviations

CDC : Centres pour le contrôle et la prévention des maladies
DIP : Données individuelles des patients
ESCC : Enquête sur la santé dans les collectivités canadiennes
IPAO : Interview sur place assistée par ordinateur
NHIS : National Health Interview Survey
SHeS : Scottish Health Survey

Déclarations

Disponibilité des données et des fichiers

Les fichiers à grande diffusion de l’ESCC non couplés peuvent être obtenus auprès de Statistique Canada et par l’intermédiaire de l’Initiative ontarienne en matière de documentation des données, de service d’extraction et d’infrastructure (www.odesi.ca). Les données de l’ESCC couplées sont mises à la disposition des chercheurs autorisés à Statistique Canada et dans les centres de données de recherche (https://www.statcan.gc.ca/fra/microdonnees/centres-donnees). Les fichiers à grande diffusion de la NHIS couplés et non couplés peuvent être téléchargés sur le site Web des CDC (www.cdc.gov/nchs/data-linkage/mortality-public.htm). On peut se procurer les données à grande diffusion de la SHeS sur le site Web du Service de données du Royaume-Uni (www.ukdataservice.ac.uk). On peut demander d’avoir accès aux données couplées de la SHeS en communiquant avec le Public Benefit and Privacy Panel for Health and Social Care (www.informationgovernance.scot.nhs.uk)..

Conflits d’intérêts

Les auteurs déclarent n’avoir aucun conflit d’intérêts.

Financement

La présente étude a été financée par une subvention de fonctionnement des Instituts de recherche en santé du Canada (MOP-142177). L’organisme qui parraine l’étude n’a joué aucun rôle dans la conception de l’étude, dans la collecte, l’analyse ou l’interprétation des données, dans la rédaction du manuscrit ou dans la décision de la soumettre pour publication. Alastair Leyland a reçu une subvention du Conseil de recherches médicales (MC_UU_12017/13) et du Bureau de l’expert scientifique en chef du gouvernement écossais (SPHSU13).

Annexe

Références
Date de modification :