Classification par entropie maximale aux fins de couplage d’enregistrements

Articles et rapports : 12-001-X202200100007

Description :

Dans le cadre d’un couplage d’enregistrements, on associe des enregistrements résidant dans des fichiers distincts que l’on pense être reliés à la même entité. Dans la présente étude, nous abordons le couplage d’enregistrements comme un problème de classification et adaptons la méthode de classification par entropie maximale de l’apprentissage automatique pour coupler des enregistrements, tant dans l’environnement d’apprentissage automatique supervisé que non supervisé. L’ensemble de couplages est choisi en fonction de l’incertitude connexe. D’une part, notre cadre de travail permet de surmonter certaines failles théoriques persistantes de l’approche classique dont les pionniers ont été Fellegi et Sunter (1969); d’autre part, l’algorithme proposé est entièrement automatique, contrairement à l’approche classique qui nécessite généralement un examen manuel afin de résoudre des cas indécis.

Numéro d'exemplaire : 2022001
Auteur(s) : Lee, Danhyang; Zhang, Li-Chun; Kim, Jae Kwang

Produit principal : Techniques d'enquête

FormatDate de sortieInformations supplémentaires
HTML21 juin 2022
PDF21 juin 2022