Applications pratiques de la génération de données synthétiques

Articles et rapports : 11-522-X202500100001
Description : Les différents secteurs utilisent de plus en plus la génération de données synthétiques (GDS) pour partager et augmenter des données tout en protégeant la vie privée ainsi que pour en éliminer les biais. Chaque fois qu'on utilise cet outil, on doit avoir recours à un ensemble distinct de mesures d'évaluation pour tenir compte de la stochasticité du processus de GDS : la vulnérabilité liée à la divulgation des membres et des attributs est essentielle pour protéger la vie privée; la fidélité et l'utilité des tâches en aval s'appliquent de manière plus générale; l'équité et la diversité sont des facteurs pertinents pour éliminer les biais et augmenter les données, respectivement. En présentant les données probantes accumulées et en examinant des études de cas modèles, il est montré que la GDS peut offrir un bon rendement dans bon nombre de ces cas d'utilisation. Dans le présent document les principaux enseignements tirés des expériences en matière de données synthétiques sur la santé sont également partagées.
Numéro d'exemplaire : 2025001
Auteur(s) : El Emam, Khaled; Pilgram, Lisa
Produit principal : La série des symposiums internationaux de Statistique Canada : recueil
Format Date de sortie Informations supplémentaires
PDF septembre 8 2025