Analyses
Filtrer les résultats par
Aide à la rechercheMot(s)-clé(s)
Résultats
Tout (1)
Tout (1) ((1 résultat))
- Articles et rapports : 12-001-X20030016609Description :
Pour automatiser le processus de vérification des données, il faut résoudre le problème de localisation des erreurs, c'est-à-dire la détermination des zones erronées dans un enregistrement incorrect. En 1976, Fellegi et Holt ont proposé un paradigme pour repérer automatiquement les erreurs. Au fil des ans, ce paradigme a été généralisé pour s'énoncer comme suit : on devrait, pour que les données d'un enregistrement satisfassent à toutes les règles de vérification, modifier les valeurs des variables dont la somme des poids de fiabilité est la plus faible possible. Par poids de fiabilité d'une variable, nous entendons un nombre non négatif précisant dans quelle mesure la valeur de cette variable est jugée fiable. Étant donné ce paradigme, il faut résoudre le problème mathématique résultant. Nous examinons ici comment les méthodes de génération de sommets peuvent être utilisées pour résoudre ce problème mathématique dans le cas de données mixtes, c'est-à-dire une combinaison de données catégoriques (discrètes) et numériques (continues). Le but principal de l'article n'est pas de présenter de nouveaux résultats, mais plutôt de combiner les idées de plusieurs auteurs afin de donner une description « complète », intégrée, de l'utilisation des méthodes de génération de sommets pour résoudre le problème de localisation des erreurs dans le cas de données mixtes. Nous décrirons surtout dans notre exposé la façon dont on peut adapter aux données mixtes les méthodes élaborées pour des données numériques.
Date de diffusion : 2003-07-31
Stats en bref (0)
Stats en bref (0) (0 résultat)
Aucun contenu disponible actuellement
Articles et rapports (1)
Articles et rapports (1) ((1 résultat))
- Articles et rapports : 12-001-X20030016609Description :
Pour automatiser le processus de vérification des données, il faut résoudre le problème de localisation des erreurs, c'est-à-dire la détermination des zones erronées dans un enregistrement incorrect. En 1976, Fellegi et Holt ont proposé un paradigme pour repérer automatiquement les erreurs. Au fil des ans, ce paradigme a été généralisé pour s'énoncer comme suit : on devrait, pour que les données d'un enregistrement satisfassent à toutes les règles de vérification, modifier les valeurs des variables dont la somme des poids de fiabilité est la plus faible possible. Par poids de fiabilité d'une variable, nous entendons un nombre non négatif précisant dans quelle mesure la valeur de cette variable est jugée fiable. Étant donné ce paradigme, il faut résoudre le problème mathématique résultant. Nous examinons ici comment les méthodes de génération de sommets peuvent être utilisées pour résoudre ce problème mathématique dans le cas de données mixtes, c'est-à-dire une combinaison de données catégoriques (discrètes) et numériques (continues). Le but principal de l'article n'est pas de présenter de nouveaux résultats, mais plutôt de combiner les idées de plusieurs auteurs afin de donner une description « complète », intégrée, de l'utilisation des méthodes de génération de sommets pour résoudre le problème de localisation des erreurs dans le cas de données mixtes. Nous décrirons surtout dans notre exposé la façon dont on peut adapter aux données mixtes les méthodes élaborées pour des données numériques.
Date de diffusion : 2003-07-31
Revues et périodiques (0)
Revues et périodiques (0) (0 résultat)
Aucun contenu disponible actuellement
- Date de modification :