Sélection de seuils basée sur le modèle pour effectuer des couplages dans le domaine agricole
Articles et rapports : 11-522-X202500100021Description : La sélection optimale de seuils représente un défi crucial au chapitre du couplage probabiliste, ayant d'importantes répercussions sur l'exactitude et la fiabilité des ensembles de données couplés. Le présent document analyse le rendement du modèle de voisinage, un modèle d'erreur récemment proposé qui modélise des erreurs de couplage en fonction du nombre de couplages de chaque enregistrement. On a évalué trois algorithmes de sélection des seuils à l'aide du modèle de voisinage, mettant en évidence les formes et les limites de chacun. On a analysé leur rendement à l'aide d'études de simulation, qui ont montré que les méthodes utilisant le modèle de voisinage ont obtenu un biais relatif inférieur par rapport à deux méthodes établies pour la sélection des seuils. En outre, l'utilité pratique a été validée par des tests d'adéquation réalisés sur quatre ensembles de données agricoles, ce qui montre que le modèle peut être utilisé dans des applications de la vie réelle.
Numéro d'exemplaire : 2025001Auteur(s) : Arsenault, ChristianProduit principal :La série des symposiums internationaux de Statistique Canada : recueil