Méthodes permettant de tenir compte de l’absence d’indépendance dans une application du modèle d’appariement des enregistrements de Fellegi-Sunter - ARCHIVÉ

Articles et rapports : 12-001-X198900114574

Description :

Soit A x B l’espace produit de deux ensembles A et B, qui est formé de concordances (paires dont les éléments représentent la même entité) et de non-concordances (paires dont les éléments représentent des entités différentes). Les règles d’appariement divisent A x B en liens (concordances désignées), en cas indéterminés (paires pour lesquelles nous reportons une décision) et en non-liens (non-concordances désignées). Suivant un intervalle fixe pour les taux d’erreur, Fellegi et Sunter (1969) ont défini une règle d’appariement optimale, c’est-à-dire une règle qui réduit au minimum l’ensemble des cas indéterminés. L’optimalité dépend de la connaissance de certaines probabilités utilisées dans un rapport de vraisemblance déterminant. En appliquant le modèle d’appariement des enregistrements, on pose souvent une hypothèse d’indépendance qui permet d’estimer les probabilités. Si l’hypothèse n’est pas satisfaite, il se peut qu’une méthode d’appariement qui utilise des estimations calculées suivant cette hypothèse ne soit pas optimale. Dans cet article, nous analysons des méthodes qui permettent de modifier les règles d’appariement lorsque l’hypothèse d’indépendance n’est pas valide. À cette fin, nous faisons une analyse empirique de listes d’entreprises pour lesquelles l’authenticité des concordances a été vérifiée. Le nombre de cas indéterminés que produisent les méthodes de calcul habituelles et les méthodes révisées peut varier selon les échantillons. Cette relation est analysée au moyen de méthodes « bootstrap » (Efron 1987).

Numéro d'exemplaire : 1989001
Auteur(s) : Winkler, W.

Produit principal : Techniques d'enquête

FormatDate de sortieInformations supplémentaires
PDF15 juin 1989
Date de modification :