Études analytiques : méthodes et références
Les fondements des examens éthiques à Statistique Canada

par Guillaume R.-Maranda
Date de diffusion : le 20 décembre 2024

Passer au texte

Début du texte

Introduction

L’éthique des données est une branche de l’éthique qui soulève les enjeux relatifs à l’utilisation appropriée des données tout au long de leur cycle de vieNote  et qui identifie les pratiques et les actions permissibles dans ce domaine. Cette discipline est mise en œuvre par le Secrétariat à l’éthique des données (SED) de Statistique Canada au moyen d’examens éthiques. Le processus d’examen éthique est une conséquence directe de l’adoption du Cadre de nécessité et de proportionnalitéNote . L’objectif du présent document est de décrire les fondements et l’objectif de ces examens. Cela peut aider les Canadiennes et les Canadiens à mieux comprendre le travail du SED et la façon dont Statistique Canada justifie ses acquisitions de données.

Depuis de nombreuses années maintenant, Statistique Canada progresse de façon constante, tant sur le plan de l’acquisition des données que sur celui des méthodes utilisées pour acquérir et analyser les données (Arora, 2018). Ces progrès peuvent être attribués à quatre causes principales : 1- un besoin de données plus détaillées et plus actuelles; 2- la baisse des taux de réponse des enquêtes traditionnelles; 3- les coûts prohibitifs des enquêtes; 4- les avancées et l’expertise technologiques. Toutes ces causes combinées ont accéléré l’acquisition de données qui ne proviennent pas d’enquêtes et, dans certains cas, l’introduction de méthodes d’enquête non probabilistes, ce qui constitue un changement de paradigmeNote  important pour un organisme national de statistique (ONS). Ce changement de paradigme soulève non seulement des questions méthodologiques, mais aussi plusieurs défis d’ordre éthique qui doivent être abordés formellement au moyen d’examens éthiques. C’est pour ces raisons que les examens éthiques sont devenus une nécessité.

Les examens éthiques servent de compléments aux processus, aux politiques et aux directives internes de Statistique Canada. Étant donné que Statistique Canada est un organisme public, il est important que ses actions s’inscrivent non seulement dans le cadre de son mandat légalNote , mais il est aussi important que l’organisme puisse fournir une justification cohérente pour expliquer la raison d’être de tout projet qui fait usage de données à différents stades de leur cycle de vie. C’est ici que les examens éthiques entrent en jeu. Les examens éthiques visent à examiner la justification éthique de l’acquisition et de l’utilisation appropriée des données. Il s’agit d’une condition nécessaire afin de garantir la possibilité de communiquer les raisons pour lesquelles Statistique Canada a besoin de données et la manière dont l’organisme garantira l’utilisation adéquate de ces dernières. Cela peut contribuer à une plus grande acceptabilité sociale et au maintien de la confiance du public qui va au-delà de l’utilisation traditionnelle des groupes de discussion.

Le présent document comporte deux sections principales. Dans la première, les examens éthiques sont définis en trois étapes qui reposent sur six principes directeurs. Dans la seconde, ces principes directeurs sont décrits de manière plus précise. On y indique que les principes ne sont pas indépendants les uns des autres, ce qui signifie qu’un examen ne se limite pas à cocher une case à côté de chacun d’entre eux.

Examens éthiques

Un examen éthique peut être défini en trois étapes opérationnelles :

  1. Obtenir les renseignements pertinents sur un projet donné.
  2. Cerner les points forts et les points faibles du projet selon des critères prédéfinis.
  3. Déterminer si un point faible l’emporte sur les points forts du projet et formuler des recommandations en conséquence.

Dans la présente section, chaque étape est précisée, ainsi que les conditions qui doivent être remplies pour les mener à bien.

La première étape est réalisée en rassemblant des renseignements selon six principes directeurs qui sont décrits plus en détail dans la prochaine section :

  • Les bénéfices pour les Canadiennes et CanadiensNote ;
  • L’équité et ne pas faire de tort,
  • La qualité;
  • La transparence et la responsabilité;
  • La vie privée et la sécurité;
  • La confiance et la durabilité.

Les renseignements recueillis en fonction de chacun de ces principes varieront selon que les données ont été obtenues dans le cadre d’une enquête ou non, car les enjeux éthiques seront différents. Par exemple, si l’on compare les deux cas, l’acquisition de données qui ne proviennent pas d’une enquête est souvent moins transparente, et les données peuvent être plus intrusives parce qu’elles peuvent contenir plus de renseignements personnels qu’il n’en faut pour mener un projet à terme. De plus, les données elles-mêmes n’ont généralement pas été acquises à des fins statistiques à l’origine, ce qui peut entraîner des problèmes de qualité particuliers susceptibles d’avoir une incidence sur l’utilisation appropriée de ces données.

C’est l’une des raisons pour lesquelles les examens éthiques à Statistique Canada sont généralement effectués à l’étape de l’acquisitionNote  dans le cadre de processus d’acquisition différents. Le fait qu’ils soient effectués à l’étape de l’acquisition permet également aux examens éthiques d’englober tous les aspects du cycle de vie des données. Il convient toutefois de mentionner que certains aspects éthiques d’un projet donné (en particulier ceux qui sont plus fondamentaux au cours des dernières étapes d’un projet) sont également visés par d’autres types d’évaluations menées par différents groupes au sein de l’organisation (p. ex. le Cadre de l’apprentissage automatique responsable à Statistique CanadaNote ).

La réussite de cette première étape doit répondre à au moins trois conditions :

  1. Les renseignements nécessaires et suffisants doivent être recueillis. Les formulaires et les principes directeurs peuvent toujours être révisés pour s’assurer que les renseignements nécessaires et suffisants sont recueillis. Cette approche pourrait conduire à une forme d’équilibre réflexif (Daniels, 2020) où l’équipe d’examen est non seulement guidée par les fondements de l’examen éthique, mais où l’expérience acquise est aussi mise à profit pour améliorer ces fondements jusqu’à ce qu’un consensus durable soit atteint (c’est-à-dire un équilibre)Note .
  2. Les renseignements recueillis doivent être véridiques. Il peut être important de consulter différents membres de l’équipe travaillant sur un projet donné afin d’obtenir un portrait complet du projet.
  3. Les renseignements ne doivent pas représenter l’opinion d’une seule personne, mais celle de l’équipe qui participe au projet. Cela est particulièrement important lorsqu’il s’agit de discuter de l’objectif et des bénéfices attendus d’un projet. La consultation de différents membres de l’équipe travaillant sur un projet donné peut fournir une vue d’ensemble qui révèle parfois des incohérences qu’il convient de résoudre.

La deuxième étape de l’examen éthique consiste à cerner les points forts et les points faibles d’un projet donné à l’aide des renseignements recueillis. Par exemple, l’évaluation de la qualité des données pourrait montrer que les données sont représentatives de la population cible et qu’elles sont globalement de bonne qualité. Cependant, la méthode de collecte pourrait être intrusive parce que les données sont personnelles et que le consentement des personnes n’a pas été obtenu. La réalisation adéquate de cette étape doit répondre à au moins deux conditions :

  1. Les personnes chargées de l’examen doivent disposer de l’expertise nécessaire pour cerner les points forts et les points faibles en fonction des six principes directeurs. Il est donc important de consulter des spécialistes et des comités composés de membres issus de différents domaines au sein de l’organisation. C’est pour cette raison que certaines évaluations sont effectuées en consultant le Comité d’éthique des données (interne) ou le Conseil consultatif pour l’éthique et la modernisation de l’accès aux microdonnées (externe)Note .
  2. Les personnes chargées de l’examen doivent examiner la qualité de la justification documentée et ne pas supposer que le projet est justifié par défaut. Cela signifie que la documentation doit se suffire à elle-même pour évaluer le fondement éthique d’un projet. Cela signifie également que si la documentation est insuffisante, la personne qui effectue l’examen ne doit pas faire de suppositions non vérifiées sur les points forts d’un projet donné. Si la documentation est incohérente, il ne faut pas se contenter de l’interpréter afin de lui donner un sens. Cela pourrait biaiser l’évaluation.

La troisième et dernière étape d’un examen éthique consiste à s’assurer que les points faibles ne l’emportent pas sur les points forts du projet et que des recommandations sont formulées en conséquence. Par exemple, si la qualité des données est médiocre parce que ces dernières ne sont pas représentatives de la population cible, cela aura une incidence sur les bénéfices attendus. Le projet devrait peut-être être exploratoire et s’immiscer le moins possible dans la vie privée des personnes.

Le niveau de cohérence recherché dans la documentation se manifestera probablement d’une manière unique en fonction de chaque cas. C’est ce qui fait de l’évaluation éthique une tâche non triviale.  Par exemple, chaque cas est susceptible de comporter ses propres bénéfices attendus, son propre niveau d’intrusion dans la vie privéeNote  et sa propre qualité de données qui devront être conjointement acceptables, compte tenu du contexte social actuel, d’un point de vue éthique. Cela laisse entendre que l’évaluation éthique doit être sensible aux particularités d’un cas donné. C’est exactement ce que signifie l’expression « l’éthique des données est contextuelle ». Cela ne suppose en aucun cas un relativisme éthique. Notre compréhension des six principes directeurs ne change pas en fonction d’un cas donné, mais leur mise en œuvre cohérente le fera.

La réussite de cette étape doit répondre à cette condition :

  1. La pondération des points forts et des points faibles par les personnes responsables de l’examen ne doit pas être arbitraire et dépendre des personnes qui évaluent un projet. Le consensus des spécialistes (c’est-à-dire l’équilibre réflexif) devrait atténuer ce problème.

À l’issue de cette étape, quatre résultats sont possibles en matière de recommandations :

  1. Aucune recommandation n’est nécessaire.
  2. Des modifications de la documentation sont nécessaires pour mieux justifier le projet.
  3. Des changements dans la mise en œuvre du projet sont nécessaires.
  4. Le projet ne doit pas être poursuivi.

Les recommandations doivent être des points de suivi menant à des actions tangibles. Il convient d’éviter les commentaires comme « Veuillez garder à l’esprit que... » ou « Veuillez envisager... ». L’objectif des examens éthiques ne se limite pas à une simple prise de conscience. Ces examens visent à s’assurer que nos acquisitions et nos utilisations de données sont éthiques, justifiées et bien documentées.

Six principes directeurs

L’approche proposée dans la section précédente ne sous-entend pas l’adoption d’une théorie morale de haut niveauNote . De telles théories sont complexes et ne sont pas universellement acceptées. Ces caractéristiques les rendent moins adaptées à un contexte où des recommandations sur un cas donné doivent être formulées sur la base des discussions d’un groupe qui n’inclut pas nécessairement des philosophes ayant reçu une formation universitaire. Ce qui a été présenté jusqu’à présent s’apparente davantage à une théorie de niveau intermédiaire (Flynn, 2020) dans laquelle six principes éthiques sont introduits dans le cadre de l’évaluation d’un cas donné.

Le choix de ces principes a été guidé non seulement par la littérature sur le sujet, mais aussi par l’expérience croissante en matière d’éthique des données au sein de Statistique Canada. L’orientation qu’ils donnent devrait être suffisamment informative pour que l’équipe d’examen se concentre sur les questions appropriées et suffisamment souple pour que l’on puisse parvenir à un consensus sur un cas donné. Cette caractéristique est cohérente avec l’expérience pratique de philosophes, comme Stephen Toulmin, qui semble indiquer [ Traduction] « qu’il peut y avoir un accord sur la façon de résoudre une question pratique entre ceux qui sont en profond désaccord sur la théorie morale qui devrait prévaloir » (Flynn, 2020).

Cette section présente chaque principe selon qu’il s’agit de l’acquisition de données d’enquêtes ou de données autres que des données d’enquêteNote . Des détails sont fournis sur le type de renseignements recueillis au cours de la première étape d’un examen éthique. La raison pour laquelle chaque principe a été ajouté à la liste est également expliquée. Il devrait être évident que l’utilisation croissante de données qui ne proviennent pas d’une enquête et de méthodes d’enquête non probabilistes rend chacun de ces principes plus pertinents que jamais.

Bénéfices pour les Canadiennes et Canadiens

Le besoin croissant de renseignements plus détaillés et plus actuels, combiné à l’alourdissement du fardeau de réponse, à la baisse des taux de réponse et au coût de la réalisation des enquêtes, a entraîné une évolution vers un recours accru à d’autres modes d’acquisition de données (p. ex. par l’intermédiaire de fournisseurs de données externes ou du moissonnage du Web). En fait, l’ancien statisticien en chef Anil Arora a souligné l’importance des sources de données autres que les enquêtes :
« Un des changements les plus importants a été d’intégrer davantage de données d’autres sources dans la production de statistiques officielles. Le volume et la variété des nouvelles sources de données augmentent de manière exponentielle partout dans le monde. Les organismes nationaux de statistique comprennent bien la valeur de ces sources. En tant qu’ONS, nous ne pouvons plus compter uniquement sur les données que nous recueillons. Plusieurs organismes ont déjà pris des mesures pour intégrer des données de sources administratives et autres dans leurs programmes et produits. » (Arora, 2022)

Ce changement présente des avantages certains, mais il s’accompagne de nouveaux défis, l’un d’entre eux étant que nous ne pouvons plus communiquer et documenter de la même manière les bénéfices attendus de nos activités pour les Canadiennes et les Canadiens. Les objectifs et les bénéfices attendus d’une enquête sont généralement communiqués dans le cadre d’une campagne de communication, du Centre de confiance de Statistique CanadaNote , et ils sont clairement inscrits sur les questionnaires ou expliqués par un intervieweur ou une intervieweuse. Par exemple, voici un extrait de ce qui était écrit sur le questionnaire du Recensement de la population de 2021 :

« Je vous remercie de prendre quelques minutes pour participer au Recensement de 2021. Les renseignements que vous fournissez sont convertis en statistiques pour que les collectivités, les entreprises et les gouvernements planifient des services et prennent des décisions éclairées relatives à l’emploi, à l’éducation, aux soins de santé, au développement du marché et plus encore. »

Ce type de stratégie de communication n’est pas possible lorsque les données ne sont pas obtenues dans le cadre d’une enquête. C’est pourquoi il est important de trouver d’autres moyens d’expliquer les raisons pour lesquelles les données que Statistique Canada souhaite acquérir sont nécessaires. L’une des méthodes consiste à documenter les bénéfices attendus d’une acquisition et à prendre des mesures proactives pour les communiquer efficacement et en temps opportun. De plus amples précisions seront fournies dans la sous-section sur la transparence et la responsabilité ci-dessous.

Les bénéfices pour les Canadiennes et Canadiens est donc un principe directeur important qui est pris en compte lors d’un examen éthique. Il peut être important de documenter les bénéfices attendus pour l’environnement, les entreprises ou les institutions, mais au bout du compte, cela devrait être avantageux pour les Canadiennes et les Canadiens, même lorsque les données concernent l’environnement, les entreprises ou les institutions. Une description adéquate des bénéfices comprend :

  1. une explication non technique, se suffisant à elle-même, de la nécessité de l’information qui est sur le point d’être acquise;
  2. au moins un exemple concret d’un bénéfice possible pour les Canadiennes et les Canadiens. Cette condition garantira que la justification n’est pas générique et qu’elle est donc plus significative. Le cas échéant, les exemples doivent rendre compte du fait que les personnes pourraient appartenir à un groupe précis. Par exemple, si les données recueillies concernent les populations autochtones, l’exemple doit s’adresser aux membres de cette communauté. Il peut s’avérer nécessaire de consulter le Centre de statistiques et de partenariats autochtones.

Soulignons que l’accent est mis ici sur la population canadienne. Cela inclut tout Canadien ou toute Canadienne et tout sous-segment de la population canadienne qui peut être influencé positivement par une activité statistique, en particulier lorsque les données y font référence spécifiquement. Cela inclut également les membres de la société qui ne sont pas des citoyennes ou citoyens canadiens, comme les immigrantes et immigrants récents et les réfugiées et réfugiés sont également inclus.

Voici un bon exemple de description qui s’adresse à un groupe précis de la population :

Le gouvernement fédéral s’est engagé à réduire les frais de garde d’enfants de 50 % d’ici à la fin de 2023 et à les ramener à 10 $ par jour d’ici 2026.  Les résultats de cette acquisition permettront au gouvernement fédéral de suivre les progrès réalisés dans le cadre de son engagement à garantir des services de garde d’enfants abordables pour toutes les familles canadiennes.  Les résultats de cette acquisition seront également utilisés pour orienter les politiques conçues pour améliorer l’accès à des services de garde d’enfants abordables et pour réduire les obstacles à la garde d’enfants pour toutes les familles canadiennes. 

Cette description est bonne parce qu’elle est complète (c’est-à-dire qu’il est possible d’en évaluer les mérites sans faire de recherches supplémentaires), elle n’est pas technique, elle s’adresse aux parents canadiens et elle donne une idée de l’utilité attendue des données qui doivent être acquises.

Voici un exemple qui n’est pas satisfaisant :

Cette acquisition permettra de combler les lacunes en matière de données et de connaissances, de soutenir une collecte de données plus représentative (c’est-à-dire à différents niveaux géographiques), d’améliorer les statistiques concernant des populations diverses de tous  les groupes d’âge, et de soutenir les politiques gouvernementales et les efforts sociétaux visant à remédier aux inégalités et à promouvoir l’équité et l’inclusion dans la prise de décision.

Cet exemple n’est pas satisfaisant, car il ne contient pas d’exemple concret afin d’illustrer la façon dont ces données peuvent être utilisées dans l’intérêt de chaque Canadien. La description est également vague (Comment cela favorisera-t-il l’équité? Quel type de prise de décision? Quelles politiques? Quels efforts sociétaux?) et par conséquent, la manière dont les données seront utilisées n’est pas claire.

De plus, dans cette description, on utilise les expressions « lacunes en matière de connaissances » et « lacunes en matière de données » sans expliquer les raisons pour lesquelles nous devons combler ces lacunes. Ce n’est pas parce qu’il y a un manque de renseignements sur un sujet donné qu’il faut nécessairement le traiter. Il y a probablement un manque de connaissances et de données sur le nombre total de fêtes d’anniversaire qui ont eu lieu en fin de semaine dernière. Il est également très probable que nous n’ayons pas besoin de combler ce manque de connaissances et de données. L’inclusion de ce principe directeur vise à garantir et à documenter que nos acquisitions répondent à un besoin d’information et que cette information sera finalement utilisée à l’avantage des Canadiennes et des Canadiens.

Il peut être plus difficile d’expliquer les bénéfices escomptés pour les Canadiennes et les Canadiens lorsque l’acquisition des données vise à améliorer ou à maintenir les opérations nécessaires à une activité statistique comme une enquête. Par exemple, lors de l’acquisition de données en vue de constituer une base de sondage, les bénéfices pour des groupes précis de la population sont plutôt faibles. Dans ce cas, il est recommandé de décrire les bénéfices attendus de l’enquête particulière que l’acquisition soutiendra.

Il ne suffit pas d’affirmer que des opérations plus efficaces permettront d’économiser des ressources et l’argent des contribuables. L’élimination d’une enquête permettrait également d’économiser de l’argent et des ressources. L’hypothèse sous-jacente est que l’enquête est suffisamment importante pour être réalisée dans le cadre d’opérations efficaces. La clé est d’expliquer son importance en premier lieu.          

En résumé, il est particulièrement important de documenter le besoin d’information et les bénéfices attendus d’une acquisition lorsque les données ne sont pas acquises dans le cadre d’une enquête. Cela ne signifie pas pour autant que l’examen éthique d’une enquête ne porte pas sur la nécessité d’une telle enquête et ses bénéfices escomptés. Il serait possible d’améliorer la façon dont ces bénéfices sont communiqués, en particulier lorsqu’une enquête est nouvelle ou lorsque de nouvelles questions sont ajoutées à un questionnaire.        

Enfin, la documentation des bénéfices attendus d’un projet est cohérente avec la neutralité politique et l’intégrité scientifique. Statistique Canada peut expliquer, sans ingérence, la façon dont ses produits analytiques peuvent être utilisés à bon escient et dans quelle mesure les politiques actuelles peuvent les utiliser à cet égard. Statistique Canada publiera également des résultats même s’ils ne correspondent pas nécessairement aux attentes initiales.

Équité et ne pas causer de tort

À bien des égards, ce principe représente le revers de la médaille des « bénéfices pour les Canadiennes et Canadiens ». Les activités statistiques peuvent être bénéfiques pour la société, mais elles peuvent également être préjudiciables dans certaines situations, en fonction d’éléments contextuels comme le sujet et la population cible. Il est important de connaître les risques et les moyens de les atténuer. Par exemple, des données biaisées peuvent nuire aux Canadiennes et aux Canadiens, et c’est pour cette raison que la qualité est l’un des principes directeurs. Cette section présente cinq exemples de torts ou d’inégalités qui peuvent être générés ou perpétués, malgré des données de bonne qualité et de bonnes intentions.

Premièrement, l’acquisition et le couplage de grandes quantités de données permettent de créer des descriptions détaillées de sous-groupes très précis. En fait, la demande de création et d’analyse de ces sous-groupes est de plus en plus forte.  Les données relatives à la police et aux ambulances, par exemple, peuvent permettre à l’analyste de créer un groupe détaillé à un niveau géographique précisNote . Il est important toutefois de garder à l’esprit que les statistiques ne sont pas créées dans un espace conceptuel vide. Chaque estimation est potentiellement publiée dans un contexte social donné qui doit être pris en compte pour s’assurer que Statistique Canada ne propage pas de stéréotypes et que le langage utilisé est approprié. Ceci est particulièrement important lorsque des renseignements sont recueillis sur des sous-populations qui peuvent être marginalisées ou qui n’ont pas le contrôle de leurs renseignements personnels (p. ex. les moins de 18 ans, les travailleurs et travailleuses du sexe, les immigrantes et immigrants illégaux, les non-citoyens et non-citoyennes, etc.). C’est pourquoi il est important de savoir si une acquisition donnée permet de cerner ou de cibler des sous-populations précises.

Cela signifie qu’un examen éthique doit recommander, le cas échéant, qu’un contexte approprié soit fourni lors de la présentation de ces données. Dans certains cas, il peut s’avérer important, avant la publication des résultats par Statistique Canada, de prendre contact de manière proactive avec les communautés concernées afin de leur faire part de nos intentions et d’en discuter. À cet effet, il peut être pertinent de consulter certains centres d’expertise au sein de l’organisation. Lorsque les données concernent plus précisément les populations autochtones, il est fortement recommandé de consulter le Centre de la statistique et des partenariats autochtones, qui est en contact régulier avec les communautés autochtones et peut utiliser son réseau pour prendre une décision à cet égard.

Les problèmes liés à la propagation des stéréotypes peuvent également se manifester dans les hypothèses qui sous-tendent une inférence statistique. Par exemple, l’utilisation d’un algorithme pour inférer l’appartenance ethnique en fonction des antécédents criminels serait une activité très délicate -voir inacceptable. C’est pour cette raison qu’il est important de s’interroger non seulement sur les objectifs finaux d’un projet donné, mais aussi sur les moyens utilisés pour les atteindre.

Deuxièmement, les données peuvent représenter une réalité où les inégalités sont prévalentes. Il est donc important de s’assurer que les données ne sont pas utilisées pour renforcer ces inégalités. Par exemple, les renseignements géographiques peuvent être fortement corrélés avec ceux comme l’appartenance ethnique et le statut socioéconomique, ce qui peut soulever des questions éthiques. Ce phénomène a été abordé dans un rapport de Bloomberg concernant les services de livraison « le jour même » d’AmazonNote . En proposant ses services dans des zones où résident leurs meilleurs clients et clientes, Amazon évitait par inadvertance les quartiers à prédominance noire ou afro-américaine (entre autres) de plusieurs villes américaines. En rendant l’accès au service plus difficile pour les personnes noires ou afro-américaines, le service est devenu fondamentalement injuste. Un examen éthique doit mobiliser suffisamment d’expertise sur un sujet donné pour éviter des problèmes similaires.

Troisièmement, la manière dont les données d’autres sources sont acquises peut également être nuisible. Le moissonnage du Web, par exemple, peut perturber un site Web s’il n’est pas effectué correctement et causer un tort économique au propriétaire du site. La qualité des données récupérées sur le Web doit également être prise en considération. Il est donc important de souligner l’importance des directives pertinentes au sein de l’organisation lors de la réalisation d’un examen éthique.

Quatrièmement, un tort pourrait survenir en cas d’atteinte à la protection des données et cela résulterait de l’incapacité de préserver la confidentialité. Des atteintes à la protection des données peuvent avoir un effet sur les personnes et les entreprises. Les bonnes pratiques sont visées plus particulièrement par le principe de « vie privée et sécurité ». Éviter de tels manquements a toujours été une priorité à Statistique Canada, et il peut être pertinent de soulever des questions liées à la sécurité au cours d’un examen éthique, en particulier lorsqu’un nouveau type d’activité statistique est proposé.

Enfin, les enquêtes peuvent causer un tort en raison de l’interaction humaine intervenant dans l’acquisition des données et des sujets de nature délicate de certaines enquêtes. Les personnes interrogées peuvent fournir des renseignements ou montrer des signes de détresse qui indiquent qu’elles pourraient avoir besoin d’aide. Le personnel chargé de mener les interviews peut être amené à gérer des situations délicates. Une bonne évaluation éthique doit aborder ces défis potentiels et recommander la mise en place de ressources et de formations appropriées. Encore une fois, la prévention de ce type de tort a toujours été une priorité au sein de l’organisation, mais il peut être pertinent de soulever des questions relatives à la détresse potentielle des répondants et répondantes au cours d’une évaluation éthique, en particulier lorsqu’il s’agit d’une nouvelle enquête. Lorsqu’on essaie de prévenir une telle source de tort, il est bon de se rappeler qu’il peut y avoir un dilemme entre la nécessité de protéger la vie privée et la nécessité de signaler les faits.

Qualité

Il n’est pas possible de documenter correctement les bénéfices attendus d’un projet et la manière dont le principe d’équité et d’absence de tort est pris en considération sans avoir une idée de la qualité des données qui vont être acquises. Les bénéfices doivent être crédibles et les sources de tort et d’injustice peuvent provenir de données de mauvaise qualité.

L’expertise et le niveau de contrôle de la qualité des données provenant d’enquêtes probabilistes sont considérables. Les défis peuvent être plus importants lorsqu’il s’agit de données qui ne proviennent pas d’enquêtes ou de données produites par des enquêtes non probabilistes. Quoi qu’il en soit, il est important de comprendre et de documenter les limites des données, sur le plan de la qualité, et d’expliquer dans quelle mesure il est possible d’atteindre les objectifs d’un projet et ses bénéfices escomptés malgré ces limites.

C’est la raison pour laquelle un examen éthique doit s’assurer d’avoir une vue d’ensemble des limites sur le plan de la qualité et s’assurer que les objectifs et les bénéfices escomptés sont crédibles. Les aspects comme la couverture, les définitions de variables, les données manquantes, l’actualité, la pertinence et les taux de réponse sont de la plus haute importance et il est possible d’avoir des renseignements à ce sujet avant même que les données ne soient acquises. On peut consulter la Trousse de la qualité des données pour obtenir de plus amples renseignementsNote .

Transparence et responsabilité

L’importance de la transparence et de la responsabilité est reconnue depuis longtemps à Statistique Canada. L’ancien statisticien en chef, Ivan Fellegi, par exemple, a déclaré que Statistique Canada avait besoin [Traduction] « d’une objectivité apolitique, d’une qualité, d’une protection rigoureuse de la confidentialité et d’une divulgation complète des méthodologies utilisées et des limites des données qui en résultent. Et bien sûr [...] une stratégie médiatique qui combine une ouverture visible à leur égard avec une défense vigoureuse de l’organisme en cas de critiques injustes ou de reportages erronés » (Fellegi, 2003). Les examens éthiques peuvent contribuer à garantir la mise en place de ces éléments en fournissant des recommandations.

L’acquisition de données autres que des données d’enquête peut ne pas supposer le consentement (explicite ou non) des personnes concernées. Si l’utilisation de ces données peut réduire le fardeau de réponse associée aux enquêtes, les personnes peuvent ne pas être conscientes de l’utilisation croissante de leurs données. Cela signifie que les personnes ont moins de contrôle sur leurs données. Il est donc important de prendre des mesures proactives pour assurer une transparence en temps opportun afin d’atténuer les problèmes liés à ce manque de contrôle. Une communication transparente sur l’utilisation des données, leur qualité et les bénéfices attendus d’un projet pour les Canadiennes et les Canadiens est essentielle. Des exemples de mesures transparentes pourraient être un message affiché sur le Centre de confiance (voir la sous-section sur la confiance et la durabilité), l’assurance que les fournisseurs de données informent leurs clients et clientes ou une sensibilisation proactive de certaines communautés particulières (voir la sous-section sur l’équité et ne pas causer de tort).

L’acquisition de données dans le cadre d’une enquête est plus transparente que l’acquisition de données administratives. Mais certains aspects des enquêtes peuvent passer inaperçus, comme les liens potentiels qui peuvent être établis avec les résultats de l’enquête ou les métadonnées qui peuvent être recueillies au cours d’une enquête (p. ex. les adresses IP). Il peut être important de garantir la transparence dans ce contexte.

La gamme de plus en plus large de services que Statistique Canada fournit à des partenaires extérieurs ouvre également la porte à des questions éthiques concernant la neutralité de l’organisation et son engagement à recueillir et à utiliser des données à des fins statistiques uniquement. La transparence est essentielle pour s’assurer que nous conservons la confiance des Canadiennes et des Canadiens. C’est le sujet de la prochaine sous-section. 

Confiance et durabilité

L’une des principales différences entre la réalisation d’une enquête et l’acquisition de données administratives est l’existence d’un fournisseur de données externe, c’est-à-dire l’entité auprès de laquelle nous obtenons les données. La relation avec cet intermédiaire peut soulever des questions éthiques. Il est important que les accords conclus par l’organisation avec les fournisseurs de données ne sapent pas la confiance des Canadiennes et des Canadiens et qu’ils soient durables, en particulier si les données sont nécessaires dans un avenir prévisible. En outre, en cas de collaboration avec d’autres organismes, il est important de discuter de la manière dont le projet s’inscrit dans le mandat de Statistique Canada (voir l’introduction). Si un projet va au-delà de l’utilisation des données à des fins statistiques uniquement, cela pourrait soulever des problèmes de confiance, car Statistique Canada pourrait outrepasser son mandat.

De manière générale, il est essentiel de s’assurer que l’acquisition ou la collecte des données est socialement acceptable, que l’organisme mène une enquête ou qu’il acquière des données d’une autre source.  La qualité des données dépend souvent de la participation de la population cible. Les questions délicates peuvent accroître la non-réponse partielle et entraîner des répercussions à long terme sur la participation du répondant ou de la répondante. Il est également important à cet égard de maintenir le niveau d’intrusion dans la vie privée proportionnel au besoin d’information.

Vie privée et sécurité

Une fois que Statistique Canada a obtenu les renseignements, il est de notre devoir de les garder en sécurité et de préserver la confidentialité. Les examens éthiques doivent tenir compte de cette obligation. Cependant, la protection de la vie privée et la confidentialité relèvent de différents groupes de spécialistes au sein de l’organisation. Les examens éthiques portent principalement sur la notion d’intrusion dans la vie privée.

La notion de vie privée est complexe et, comme on le sait, difficile à définir (voir Nissenbaum, 2019; Martin, 2016; Francis et Francis, 2017; Mulligan, Koopman et Doty, 2016). Certaines définitions donnent l’impression que la vie privée est tout simplement inexistante et incompatible avec le mandat de Statistique Canada. Voici l’une de ces définitions : « La vie privée est le droit de se retirer et de ne pas être sujet à une quelconque forme de surveillance et d’intrusion. ». Il n’y a pas beaucoup de situations dans la vie moderne où ces conditions sont réunies.

Dans le présent document, la protection de la vie privée est considérée comme une force limitative qui peut évoluer en fonction des événements mondiaux sur i) la quantité de renseignements; ii); la manière dont nous pouvons éthiquement acquérir des renseignements; et iii) la nature de l’entité qui recueille les renseignements (p. ex. Statistique Canada). Traditionnellement, le concept de protection de la vie privée s’applique aux renseignements concernant des personnes ou des groupes de personnes identifiables, mais ces restrictions peuvent également s’appliquer lorsque l’information concerne des entreprises ou des institutions. Dans la présente section, les questions relatives à chacun des trois points sont présentées dans l’ordre.

Une bonne documentation doit justifier la quantité de renseignements (p. ex. la taille de l’échantillon et le nombre de variables) qui sont recueillis. Plus précisément, le niveau d’agrégation (résolution dans le cas des images) et la fréquence des mises à jour nécessaires pour atteindre les objectifs d’un projet doivent être justifiés de manière à ce qu’il soit clair que l’on n’acquiert pas plus de renseignements que nécessaire. Dans les cas où l’on acquiert plus de renseignements que nécessaire, des mesures doivent être prises pour s’assurer que l’on a accès à cette information au sein de l’organisation selon le principe du besoin de savoir. En se conformant à ce principe de proportionnalité, la vie privée est respectée en tant que force modératrice en matière d’acquisition des données.

Toutefois, il faut aller plus loin dans la prise en compte de la vie privée. Cette idée de proportionnalité s’applique également à la manière dont nous acquérons les données : nos opérations de collecte ne doivent pas être plus intrusives que nécessaire. Une opération de collecte peut être intrusive en raison du temps nécessaire pour remplir un questionnaire, parce qu’un intervieweur ou une intervieweuse doit visiter un ménage ou lui téléphoner (parfois plus d’une fois), ou parce que des mesures physiques sont prises (p. ex. le prélèvement d’échantillons de sang). Ces dimensions doivent être prises en considération lors d’un examen éthique afin d’évaluer leur proportionnalité. Par exemple, la présence d’un intervieweur ou d’une intervieweuse peut ne pas être nécessaire et peut même nuire à l’acquisition de renseignements personnels dans certains cas précis.

Une méthode de collecte peut également être intrusive lorsqu’une personne perd le contrôle de l’utilisation et de la propriété de ses renseignements personnels. Dans le cas des enquêtes, cela peut se produire lorsqu’une personne est invitée à fournir des renseignements personnels sur un autre membre du ménage. En ce qui concerne les données autres que des données d’enquête, il convient de mentionner qu’elles sont souvent utilisées à des fins différentes de celles pour lesquelles elles ont été obtenues à l’origine. En fait, cela est parfois inclus dans la définition même de « données administratives ». Cette forme d’intrusion dans la vie privée, reconnue par de nombreux statisticiens en chef (voir Fellegi, 2003 et Smith, 2013), doit être abordée dans le cadre d’un examen éthique. D’autres sources crédibles doivent être envisagées pour justifier la proportionnalité d’une méthode de collecte donnée.

Enfin, la nature de l’entité qui recueille l’information peut limiter les renseignements qu’elle peut obtenir. Par exemple, le fait que les banques disposent de renseignements détaillés sur les finances d’une personne peut être considéré comme moins intrusif que si Statistique Canada obtenait les mêmes renseignements, simplement parce que Statistique Canada est une entité gouvernementale. Il s’agit d’une dimension importante à prendre en considération lors d’un examen éthique.

En conclusion, il convient de souligner que pour modérer de manière adéquate la quantité de données, la manière dont nous acquérons les données et pour déterminer si Statistique Canada doit recueillir ces données, tous les autres principes doivent être pris en considération. C’est la raison pour laquelle la section sur la vie privée et la sécurité a été présentée en dernier lieu. Il s’agit de l’élément le plus global et le plus difficile à évaluer dans le cadre d’une évaluation.

Conclusion

En résumé, le présent document fournit une définition opérationnelle d’un examen éthique à Statistique Canada. Cet examen comporte trois étapes :

  1. Obtenir les renseignements pertinents sur un projet donné.
  2. Cerner les points forts et les points faibles du projet.
  3. Déterminer si un point faible l’emporte sur les points forts du projet et formuler des recommandations en conséquence.

Six principes directeurs sont utilisés pour achever la première étape : les bénéfices pour les Canadiennes et les Canadiens; l’équité et ne pas causer de tort; la qualité; la transparence et la responsabilité; la confidentialité et la sécurité; la confiance et la durabilité. Chacun de ces principes directeurs est évalué en fonction du type de données acquises : des données d’enquête ou des données autres que des données d’enquête.  Grâce à ces connaissances, il est possible de mieux comprendre les exigences d’un examen et de mieux s’y préparer (étapes 2 et 3). Le résultat devrait permettre de mieux justifier un projet qui repose sur des données à n’importe quel stade de son cycle de vie. Il devrait permettre de maximiser à la fois la protection de la vie privée et la production de renseignements et donc être conforme au Cadre de nécessité et de proportionnalité de Statistique CanadaNote .

Le paysage a changé à Statistique Canada en ce qui concerne la mise en œuvre de l’éthique des données et de ses principes. L’évolution se poursuivra afin de répondre aux besoins en matière de données au sein de l’organisation et dans la société en général. Par exemple, il existe un besoin croissant de lignes directrices plus précises sur l’utilisation éthique des données désagrégées. Le présent document jette les bases pour de futurs travaux.

Bibliographie

Arora, A. (2018), « Modernisation du système statistique national : consultations avec les partenaires », Catalogue 89200003. Statistique Canada. ISBN 978-0-660-31580-5.

Arora, A. (2022), « Notes d’allocution pour la 37e rencontre du groupe de Voorburg sur la statistique des services », Notes d’allocution pour la 37e rencontre du groupe de Voorburg sur la statistique des services (statcan.ca).

Bird, A. (2018), « Thomas Kuhn », The Stanford Encyclopedia of Philosophy (Winter 2018 Edition), Edward N. Zalta (éd.),

Daniels, N. (2020), « Reflective Equilibrium », The Stanford Encyclopedia of Philosophy (Summer 2020 Edition), Edward N. Zalta (éd.),

DeBlois, S., et D., Côté, A.-M. (2021), « Perceptions of data sensitivity: Study with Questionnaire Testing Participants », QDRC, ICMIC.

Fellegi, I. P. (2003), « Official Statistics: Pressures and Challenges ISI President’s Invited Lectures », International Statistical Review / Revue Internationales de Statistique, 72 (1) : 139-155.

Floridi, L. et Taddeo, M. (2016), « What is data ethics? », Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences, 374 : 20160360.

Flynn, J. (2020), « Theory and Bioethics », The Stanford Encyclopedia of Philosophy (Spring 2021 Edition), Edward N. Zalta (éd.),

Francis, L. et Francis J. (2017), Privacy : What Everyone Needs to Know, Oxford University Press.

Government Digital Service (2020), Data Ethics Framework, Data Ethics Framework - GOV.UK (www.gov.uk)

Martin, R. (2016), « Understanding Privacy Online: Development of a Social Contract Approach to Privacy », Journal of Business Ethics, 137 : 551-569.

Mittelstadt, B. D., Allo, P., Taddeo, M., Wachter, S., et Floridi, L., (2016), « The ethics of algorithms: Mapping the debate », Big Data & Society, 3 (2) : 2053951716679679.

Mulligan, D. K., Koopman, C. et Doty, N. (2016), « Privacy is an essentially contested concept: a multi-dimensional analytic for mapping privacy », Philosophical Transactions of the Royal Society A: Mathematical, Physical and Engineering Sciences, 374 : 20160118.

Nissenbaum, H. (2019), « Contextual integrity up and down the data food chain », Theoretical Inquiries in Law, 20 (1) : 221-256.

Rancourt, E. (2019), « The scientific approach as a transparency enabler throughout the data life-cycle », Statistical Journal of the IAOS, 35 : 549-558.

Smith, W. (2013), « The Collection of Official Statistics in a Modern Democracy » : The Collection of Official Statistics in a Modern Democracy (statcan.gc.ca)

Date de modification :