Évaluation du risque de divulgation de données synthétiques : une revue de littérature
Articles et rapports : 11-522-X202500100016Description : L'adoption de la production de données synthétiques comme mesure de confidentialité augmente dans les organismes statistiques du monde entier, y compris à Statistique Canada. Cette approche offre une solution de rechange à la diffusion classique de fichiers publics anonymisés de microdonnées, répondant ainsi aux préoccupations en matière de protection de la vie privée et d'utilité des données. La création de données synthétiques présente toutefois des défis au niveau de l'évaluation et de l'atténuation du risque de divulgation. Le présent article passe en revue les différents types de risques de divulgation, soit la divulgation d'attribut, la divulgation de données d'adhésion et la divulgation de l'identité, et présente certaines des méthodes connexes pour mesurer le risque. L'article présente les grandes mesures d'évaluation des risques et examine les méthodes pratiques de contrôle de la divulgation dans le cadre de la synthèse des données. Les méthodes d'évaluation des risques de divulgation produisent habituellement une mesure qui peut servir à jauger le risque, mais il y a peu de consensus sur les valeurs limites de ces mesures. Il importe également de souligner l'importance de trouver le juste équilibre entre l'utilité et la confidentialité, ce qui nécessite une discussion plus approfondie dans le contexte de ces méthodes. L'article se termine en offrant des idées et des recommandations sur la gestion du risque de divulgation lors de la création de données synthétiques. Il offre également quelques perspectives sur les orientations futures de la recherche et les répercussions pratiques de la gestion des risques de divulgation par l'entremise des données synthétiques.
Numéro d'exemplaire : 2025001Auteur(s) : Yu, Zhe SiProduit principal :La série des symposiums internationaux de Statistique Canada : recueil