Analyses
Filtrer les résultats par
Aide à la rechercheMot(s)-clé(s)
Auteur(s)
Résultats
Tout (2)
Tout (2) ((2 résultats))
- Articles et rapports : 12-001-X201100111444Description :
L'appariement des données consiste à jumeler des enregistrements issus de deux fichiers ou plus que l'on pense appartenir à une même unité (par exemple une personne ou une entreprise). Il s'agit d'un moyen très courant de renforcer la dimension temporelle ou des aspects tels que la portée ou la profondeur des détails. Souvent, le processus d'appariement des données n'est pas exempt d'erreur et peut aboutir à la formation d'une paire d'enregistrements qui n'appartiennent pas à la même unité. Alors que le nombre d'applications d'appariement d'enregistrements croît exponentiellement, peu de travaux ont porté sur la qualité des analyses effectuées en se servant des fichiers de données ainsi appariées. Traiter naïvement ces fichiers comme s'ils ne contenaient pas d'erreurs mène, en général, à des estimations biaisées. Le présent article décrit l'élaboration d'un estimateur du maximum de vraisemblance pour les tableaux de contingence et la régression logistique en présence de données incorrectement appariées. Simple, cette méthode d'estimation est appliquée en utilisant l'algorithme EM bien connu. Dans le contexte qui nous occupe, l'appariement probabiliste des données est une méthode reconnue. Le présent article démontre l'efficacité des estimateurs proposés au moyen d'une étude empirique s'appuyant sur cet appariement probabiliste.
Date de diffusion : 2011-06-29 - Articles et rapports : 11-522-X200600110401Description :
L'Australian Bureau of Statistics (ABS) entamera la création d'un ensemble de données statistiques longitudinales de recensement (EDSLR) en sélectionnant un échantillon de 5 % de personnes provenant de la population du Recensement de 2006 en vue de le coupler de manière probabiliste aux données des futurs recensements. L'un des objectifs à long terme est de profiter de la force des riches données démographiques longitudinales fournies par l'EDSLR pour offrir des éclaircissements sur diverses questions qui ne peuvent être résolues à l'aide de données transversales. L'EDSLR pourrait être amélioré par couplage probabiliste avec les données sur les naissances, les décès et l'immigration, ainsi qu'avec celles des registres des maladies. Le présent article décrit brièvement les progrès récents dans le domaine du couplage des données à l'ABS, expose les grandes lignes, la méthodologie de couplage des données et les mesures de la qualité qui ont été envisagées et résume les résultats provisoires à l'aide des données du test du recensement.
Date de diffusion : 2008-03-17
Stats en bref (0)
Stats en bref (0) (0 résultat)
Aucun contenu disponible actuellement
Articles et rapports (2)
Articles et rapports (2) ((2 résultats))
- Articles et rapports : 12-001-X201100111444Description :
L'appariement des données consiste à jumeler des enregistrements issus de deux fichiers ou plus que l'on pense appartenir à une même unité (par exemple une personne ou une entreprise). Il s'agit d'un moyen très courant de renforcer la dimension temporelle ou des aspects tels que la portée ou la profondeur des détails. Souvent, le processus d'appariement des données n'est pas exempt d'erreur et peut aboutir à la formation d'une paire d'enregistrements qui n'appartiennent pas à la même unité. Alors que le nombre d'applications d'appariement d'enregistrements croît exponentiellement, peu de travaux ont porté sur la qualité des analyses effectuées en se servant des fichiers de données ainsi appariées. Traiter naïvement ces fichiers comme s'ils ne contenaient pas d'erreurs mène, en général, à des estimations biaisées. Le présent article décrit l'élaboration d'un estimateur du maximum de vraisemblance pour les tableaux de contingence et la régression logistique en présence de données incorrectement appariées. Simple, cette méthode d'estimation est appliquée en utilisant l'algorithme EM bien connu. Dans le contexte qui nous occupe, l'appariement probabiliste des données est une méthode reconnue. Le présent article démontre l'efficacité des estimateurs proposés au moyen d'une étude empirique s'appuyant sur cet appariement probabiliste.
Date de diffusion : 2011-06-29 - Articles et rapports : 11-522-X200600110401Description :
L'Australian Bureau of Statistics (ABS) entamera la création d'un ensemble de données statistiques longitudinales de recensement (EDSLR) en sélectionnant un échantillon de 5 % de personnes provenant de la population du Recensement de 2006 en vue de le coupler de manière probabiliste aux données des futurs recensements. L'un des objectifs à long terme est de profiter de la force des riches données démographiques longitudinales fournies par l'EDSLR pour offrir des éclaircissements sur diverses questions qui ne peuvent être résolues à l'aide de données transversales. L'EDSLR pourrait être amélioré par couplage probabiliste avec les données sur les naissances, les décès et l'immigration, ainsi qu'avec celles des registres des maladies. Le présent article décrit brièvement les progrès récents dans le domaine du couplage des données à l'ABS, expose les grandes lignes, la méthodologie de couplage des données et les mesures de la qualité qui ont été envisagées et résume les résultats provisoires à l'aide des données du test du recensement.
Date de diffusion : 2008-03-17
Revues et périodiques (0)
Revues et périodiques (0) (0 résultat)
Aucun contenu disponible actuellement
- Date de modification :