Applications pratiques de la génération de données synthétiques
Articles et rapports : 11-522-X202500100001Description : Les différents secteurs utilisent de plus en plus la génération de données synthétiques (GDS) pour partager et augmenter des données tout en protégeant la vie privée ainsi que pour en éliminer les biais. Chaque fois qu'on utilise cet outil, on doit avoir recours à un ensemble distinct de mesures d'évaluation pour tenir compte de la stochasticité du processus de GDS : la vulnérabilité liée à la divulgation des membres et des attributs est essentielle pour protéger la vie privée; la fidélité et l'utilité des tâches en aval s'appliquent de manière plus générale; l'équité et la diversité sont des facteurs pertinents pour éliminer les biais et augmenter les données, respectivement. En présentant les données probantes accumulées et en examinant des études de cas modèles, il est montré que la GDS peut offrir un bon rendement dans bon nombre de ces cas d'utilisation. Dans le présent document les principaux enseignements tirés des expériences en matière de données synthétiques sur la santé sont également partagées.
Numéro d'exemplaire : 2025001Auteur(s) : El Emam, Khaled; Pilgram, LisaProduit principal :La série des symposiums internationaux de Statistique Canada : recueil