Assurance de la qualité

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Géographie

2 facets displayed. 0 facets selected.

Contenu

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (250)

Tout (250) (160 à 170 de 250 résultats)

  • Articles et rapports : 11-522-X20010016281
    Description :

    Cette publication comporte une description détaillée des questions techniques entourant la conception et la réalisation d'enquêtes et s'adresse surtout à des méthodologistes.

    Des méthodes permettant d'évaluer l'erreur d'échantillonnage liée à l'estimation non désaisonnalisée du niveau de l'Index of Production (IoP) ont été mises au point antérieurement en s'appuyant sur la méthode de linéarisation par série de Taylor et sur la méthode bootstrap paramétrique; les deux méthodes ont produit des résultats comparables. L'étude de l'erreur d'échantillonnage a mené à la conclusion que la méthode bootstrap paramétrique est celle qui est la plus facile à mettre en oeuvre. Le présent document décrit la méthode mise au point pour évaluer l'erreur d'échantillonnage qui entache l'estimation de la variation non désaisonnalisée de l'IoP par la méthode bootstrap paramétrique, ainsi que les données requises provenant de chacune des enquêtes qui contribuent à la production de l'indice, les hypothèses formulées et les problèmes pratiques qu'il a fallu surmonter.

    Date de diffusion : 2002-09-12

  • Articles et rapports : 11-522-X20010016282
    Description :

    Cette publication comporte une description détaillée des questions techniques entourant la conception et la réalisation d'enquêtes et s'adresse surtout à des méthodologistes.

    La Base de données sur les congés des patients (BDCP) est l'un des dépôts de données importants tenus à jour par l'Institut canadien d'information sur la santé (ICIS). Ce dernier est un organisme national, sans but lucratif, qui joue un rôle essentiel dans l'élaboration du système canadien d'information sur la santé. La BDCP contient des données sur les sorties des patients ayant reçu des soins de courte durée transmises à l'ICIS par la plupart des hôpitaux canadiens. Les données recueillies sont indispensables à la détermination, par exemple, du nombre et du genre d'interventions et de la durée des hospitalisations. L'ICIS est en train de réaliser la première étude nationale de la qualité de certaines données cliniques et administratives contenues dans la BDCP. Cette étude a pour but d'évaluer l'exactitude des données de la BDCP par comparaison des sources de données aux renseignements qui figurent dans la base de données de l'ICIS, afin de repérer toute discordance et d'en établir les causes. Le présent document traite de l'étude de la qualité des données de la BDCP et fournit certains résultats provisoires. Ces résultats sont également comparés brièvement à ceux d'une étude similaire. Pour conclure, on passe en revue les étapes ultérieures de l'étude et la façon dont les résultats des travaux de la première année permettent d'améliorer la qualité de la BDCP.

    Date de diffusion : 2002-09-12

  • Articles et rapports : 11-522-X20010016283
    Description :

    Cette publication comporte une description détaillée des questions techniques entourant la conception et la réalisation d'enquêtes et s'adresse surtout à des méthodologistes.

    L'enregistrement fidèle du statut d'autochtone des patients qui prennent congé de l'hôpital est essentiel à l'analyse de l'usage que font les Autochtones et les Australiens (du détroit de Torres) des services de santé. D'ailleurs, l'état de santé de ces derniers laisse souvent à désirer. La notion même de précision des données est toutefois mal comprise. En 1998, on a réalisé dans 11 hôpitaux publics un projet pilote portant sur les méthodes d'évaluation de l'exactitude des données. On a recueilli des renseignements, par interview, sur 8 267 patients et on les a comparés aux données correspondances de collecte courante. Dans ces centres hospitaliers, la proportion de patients dont on avait fidèlement consigné le statut autochtone variait de 55 % À 100 %. Dans l'ensemble, les hôpitaux comptant proportionnellement un grand nombre d'autochtones sur leur territoire présentaient des données plus exactes. Depuis, on s'est servi de la méthode appliquée pour juger de la qualité de l'information dans les hôpitaux de deux États australiens afin de promouvoir l'adoption de meilleures pratiques de collecte de données.

    Date de diffusion : 2002-09-12

  • Articles et rapports : 11-522-X20010016284
    Description :

    Cette publication comporte une description détaillée des questions techniques entourant la conception et la réalisation d'enquêtes et s'adresse surtout à des méthodologistes.

    Depuis 1965, le National Center for Health Statistics réalise l'enquête nationale sur les congés d'hôpital (ENCH), qui est une enquête nationale réalisée au moyen d'un échantillon probabiliste des registres de sortie d'hôpitaux non fédéraux de courte durée ou de centres hospitaliers généraux. Un grand volet du projet de remaniement de l'ENCH en 1988 a consisté à exploiter des données électroniques tirées des systèmes nationaux et des systèmes d'information des organismes de services. Ce document donne un aperçu de l'évolution de l'enquête et du remaniement de 1988. Il examine les méthodes d'enquête à la lumière des questions de collecte et de traitement des données d'extraction manuelle et automatisée. Les auteurs analysent les méthodes d'évaluation de la qualité et de la précision des données de l'ENCH pour l'un et l'autre des modes de collecte. Parmi ces méthodes, on doit ranger celles qui garantissent que les données reçues respectent les normes établies et que l'information extraite soit traitée et codée suivant des règles strictes de contrôle de qualité. Enfin, ils présentent ces dernières dans le contexte des questions et des constatations des études plus générales consacrées à la qualité des ensembles de données administratives hospitalières.

    Date de diffusion : 2002-09-12

  • Articles et rapports : 11-522-X20010016285
    Description :

    Cette publication comporte une description détaillée des questions techniques entourant la conception et la réalisation d'enquêtes et s'adresse surtout à des méthodologistes.

    Les trois documents présentés ici nous apportent une connaissance approfondie de la qualité des données liées à morbidité hospitalière. Richards, Brown et Homan ont échantillonné les dossiers des hôpitaux pour évaluer les données administratives au Canada, Hargreaves a échantillonné les patients hospitalisés pour une même évaluation en Australie, tandis que McLemore et Pokras donnent une description des pratiques de contrôle de la qualité dans le cadre d'une enquête-échantillon continue portant sur les dossiers hospitaliers des États-Unis. On présente chacun des exposés, ainsi que les enjeux et les défis de demain.

    Date de diffusion : 2002-09-12

  • Articles et rapports : 11-522-X20010016286
    Description :

    Cette publication comporte une description détaillée des questions techniques entourant la conception et la réalisation d'enquêtes et s'adresse surtout à des méthodologistes.

    Il est de règle que les organismes statistiques vérifient les tableaux dont certaines cellules ont été supprimées afin de s'assurer que la protection contre la divulgation accidentelle de renseignements confidentiels est suffisante. Lorsque le tableau contient des valeurs arrondies, il arrive que la méthode de vérification ne tienne pas compte de cette situation. Cette omission peut donner lieu à une surprotection qui réduit l'utilité des données publiées. Dans le présent document, nous proposons une formule de vérification correcte et donnons des exemples de surprotection.

    Date de diffusion : 2002-09-12

  • Articles et rapports : 11-522-X20010016288
    Description :

    Cette publication comporte une description détaillée des questions techniques entourant la conception et la réalisation d'enquêtes et s'adresse surtout à des méthodologistes.

    À l'occasion du recensement économique (U.S. Economic Census) de 2002 qui aura lieu prochainement aux États-Unis, les entreprises auront le choix de soumettre leurs données sur support imprimé ou électronique. La déclaration électronique se fera au moyen de questionnaires à remplir soi-même informatisés (QRSI) pour Windows. Le U.S. Census Bureau offrira l'option de déclaration électronique à l'ensemble des répondants à l'aide de plus de 650 formulaires différents. En outre, il a formé une équipe interdivisionnaire chargée d'élaborer un guide de rédaction des formulaires électroniques, décrivant les normes de conception à respecter pour créer les formulaires électroniques et assurant une qualité uniforme pour ce qui est de la conception des formulaires.

    La production du guide de rédaction a pour but d'uniformiser les travaux des divers analystes qui peuvent s'occuper d'éléments différents d'un projet de développement de logiciel (un QRSI en l'occurrence). Les membres de l'équipe ont conclu que le guide de rédaction devait inclure des normes concernant la présentation et la conception des écrans, la navigation, le graphisme, les fonctions de vérification, la fonction d'aide, la rétroaction, les pistes de vérification et l'accessibilité pour les utilisateurs handicapés.

    Les membres de l'équipe se sont engagés à élaborer plusieurs sections du guide de rédaction. Ils se sont réunis chaque semaine pour discuter des sections et les passer en revue. Ils ont également procédé à des tests d'utilisation des règles de vérification, et les employés des divisions spécialisées ont formulé des recommandations à l'intention des cadres supérieurs. Les membres de l'équipe ont réalisé les tests d'utilisation à l'aide de formulaires prototypes auprès de répondants réels. Au besoin, ils se sont adressés aux employés des divisions spécialisées pour qu'ils les aident à prendre des décisions concernant certains formulaires, lorsque les contraintes du support électronique exigeaient des modifications par rapport au formulaire imprimé.

    Le guide de rédaction représentera la norme de développement pour l'ensemble des QRSI qui seront utilisés dans le cadre du recensement économique de 2002; il permettra ainsi d'assurer l'uniformité entre les divers programmes d'enquête.

    Date de diffusion : 2002-09-12

  • Articles et rapports : 11-522-X20010016289
    Description :

    Cette publication comporte une description détaillée des questions techniques entourant la conception et la réalisation d'enquêtes et s'adresse surtout à des méthodologistes.

    La demande croissante de déclaration électronique dans les enquêtes auprès des établissements a mis en évidence la nécessité de faciliter l'utilisation des formules électroniques. Nous commençons à peine à en comprendre les conséquences sur le plan de la conception de ces formules. Les interviews cognitives et les tests d'utilisation sont analogues par la convergence des buts de ces deux catégories d'essais, l'objectif étant d'élaborer un instrument final sur papier ou sur support électronique qui réduit tant le fardeau de réponse que l'erreur de mesure. Les tests cognitifs ont grandement influé sur la conception de formules sur papier et sont aussi applicables à l'élaboration de formules électroniques. Les tests d'utilisation étendent l'application des méthodes existantes des tests cognitifs à un examen de l'interaction qui se crée entre le répondant et la formule électronique qu'il utilise.

    Le prochain recensement économique en 2002 aux États-Unis donnera aux entreprises la possibilité de faire leur déclaration sur formule électronique. Le Census Bureau est en train d'élaborer un guide de rédaction des formules électroniques qui énoncera des normes de conception de telles formules. Les normes qui figurent dans ce guide sont fondées sur les principes de facilité d'utilisation, les résultats de tests d'utilisation et de tests cognitifs et les règles de conception d'interface utilisateur graphique (IUG). Le présent document met en lumière les grandes questions de conception de formules électroniques qui ont été soulevées pendant l'élaboration du guide de rédaction et expose comment les tests d'utilisation et les interviews cognitives ont permis de les résoudre.

    Date de diffusion : 2002-09-12

  • Articles et rapports : 11-522-X20010016292
    Description :

    Cette publication comporte une description détaillée des questions techniques entourant la conception et la réalisation d'enquêtes et s'adresse surtout à des méthodologistes.

    La statistique peut servir la société, mais si elle fait l'objet d'une manipulation politique ou autre, elle peut devenir un instrument à la disposition des puissants pour la préservation du statu quo, voire l'oppression. Les statisticiens à l'oeuvre sur le plan international, qui font ordinairement partie d'organismes internationaux, supranationaux ou bilatéraux, se heurtent à diverses difficultés dans leur tentative d'agir utilement sur la vie des plus pauvres de la planète. Pour les statisticiens, un des problèmes les plus épineux est le dilemme de la libre reddition de comptes et de la souveraineté nationale (pour ce qui est de la nature des données recueillies, des méthodes employées et des destinataires visés des résultats). Les statisticiens travaillent dans un contexte qui change constamment en raison de la mondialisation et du renouvellement des modes de coopération et de partenariat à des fins de développement.

    Le présent document, traite des problèmes d'amélioration de la qualité des données transnationales. L'objectif de cette publication est de mieux faire connaître le rôle des statisticiens à l'oeuvre sur le plan international, d'exposer certaines des contraintes qui leur sont faites, de considérer les principes qui devraient régir les activités générales des statisticiens et de jauger l'intérêt de tels principes pour les statisticiens internationaux en particulier. De plus, le document s'inspire du récent message du président à la Royal Statistical Society (présentation en juin 2001; série D JRSS, à paraître).

    Date de diffusion : 2002-09-12

  • Articles et rapports : 11-522-X20010016296
    Description :

    Cette publication comporte une description détaillée des questions techniques entourant la conception et la réalisation d'enquêtes, et s'adresse surtout à des méthodologistes.

    L'Enquête canadienne sur la population active (EPA) est une des plus importantes enquêtes de Statistique Canada. Elle recueille tous les mois des données auprès d'environ 52 000 ménages sur leur situation par rapport à la population active, la nature de leur travail ou leur raison de ne pas travailler, ainsi que leurs caractéristiques démographiques. L'erreur de couverture constitue une importante mesure de la qualité des données pour toute enquête. Une des mesures clés de l'erreur de couverture dans l'EPA est l'écart de pourcentage entre les estimations du Recensement de la population et les chiffres de population de l'enquête : on l'appelle le glissement. Une valeur négative indique que l'EPA a un problème de surcouverture, tandis qu'une valeur positive indique un problème de sous-couverture. De façon générale, le glissement est positif, ce qui signifie que l'EPA oublie constamment des personnes qui auraient dû être dénombrées.

    Cette étude visait à déterminer les raisons de la hausse du taux de glissement et les moyens à prendre pour y mettre fin. L'étude s'est déroulée en deux étapes. On a d'abord entrepris un examen historique des projets qui devaient servir à contrôler le glissement dans l'EPA, ainsi que les modifications opérationnelles qui ont été apportées au fil des ans. À la seconde étape, on a analysé des facteurs comme les taux de vacance, la non-réponse, les variables démographiques, la situation urbaine ou rurale et leurs répercussions sur le taux de glissement.

    Date de diffusion : 2002-09-12
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (171)

Analyses (171) (30 à 40 de 171 résultats)

  • Articles et rapports : 11F0019M2013351
    Géographie : Canada
    Description :

    Les mesures du bien être subjectif occupent une place de plus en plus importante dans les discussions stratégiques qui se tiennent à l'échelle internationale concernant la question de savoir quel est le meilleur moyen de mesurer le « progrès sociétal » et le bien être des populations nationales. Ce point a des conséquences pour les organismes statistiques nationaux, car on leur demande d'incorporer à leurs enquêtes ménages des mesures du bien être subjectif (Organisation de coopération et de développement économiques, 2013). Cela fait 25 ans que Statistique Canada incorpore à ses enquêtes des mesures du bien être subjectif - particulièrement la satisfaction à l'égard de la vie - quoique le libellé des questions et les catégories de réponses aient évolué avec le temps. Ainsi, l'Enquête sociale générale (ESG) et l'Enquête sur la santé dans les collectivités canadiennes (ESCC) de Statistique Canada fournissent une bonne occasion de procéder à un examen de la stabilité des réponses aux questions sur la satisfaction à l'égard de la vie et de leurs corrélats au fil des ans à l'intérieur d'un cadre analytique cohérent.

    Date de diffusion : 2013-10-11

  • Articles et rapports : 82-003-X201300811857
    Géographie : Canada
    Description :

    À partir des données du Registre canadien du cancer, de la statistique de l'état civil et de statistiques sur la population, la présente étude examine l'hypothèse de ratios de taux d'incidence et de mortalité normalisés selon l'âge et propres au sexe et au siège du cancer stables d'une région à l'autre, qui sous tend l'indicateur de la complétude de la détermination des cas de la North American Association of Central Cancer Registries (NAACCR).

    Date de diffusion : 2013-08-21

  • Articles et rapports : 12-001-X201200211751
    Description :

    La qualité des enquêtes est un concept multidimensionnel issu de deux démarches de développement distinctes. La première démarche suit le paradigme de l'erreur d'enquête totale, qui repose sur quatre piliers dont émanent les principes qui guident la conception de l'enquête, sa mise en oeuvre, son évaluation et l'analyse des données. Nous devons concevoir les enquêtes de façon que l'erreur quadratique moyenne d'une estimation soit minimisée compte tenu du budget et d'autres contraintes. Il est important de tenir compte de toutes les sources connues d'erreur, de surveiller les principales d'entre elles durant la mise en oeuvre, d'évaluer périodiquement les principales sources d'erreur et les combinaisons de ces sources après l'achèvement de l'enquête, et d'étudier les effets des erreurs sur l'analyse des données. Dans ce contexte, on peut mesurer la qualité d'une enquête par l'erreur quadratique moyenne, la contrôler par des observations faites durant la mise en oeuvre et l'améliorer par des études d'évaluation. Le paradigme possède des points forts et des points faibles. L'un des points forts tient au fait que la recherche peut être définie en fonction des sources d'erreur et l'un des points faibles, au fait que la plupart des évaluations de l'erreur d'enquête totale sont incomplètes, en ce sens qu'il est impossible d'inclure les effets de toutes les sources. La deuxième démarche est influencée par des idées empruntées aux sciences de la gestion de la qualité. Ces sciences ont pour objet de permettre aux entreprises d'exceller dans la fourniture de produits et de services en se concentrant sur leurs clients et sur la concurrence. Ces idées ont eu une très grande influence sur de nombreux organismes statistiques. Elles ont notamment amené les fournisseurs de données à reconnaître qu'un produit de qualité ne peut pas être obtenu si la qualité des processus sous-jacents n'est pas suffisante et que des processus de qualité suffisante ne peuvent pas être obtenus sans une bonne qualité organisationnelle. Ces divers niveaux peuvent être contrôlés et évalués au moyen d'ententes sur le niveau de service, de sondages auprès des clients, d'analyses des paradonnées en recourant au contrôle statistique des processus et d'évaluations organisationnelles en se servant de modèles d'excellence opérationnelle ou d'autres ensembles de critères. À tous les niveaux, on peut rehausser la qualité en lançant des projets d'amélioration choisis selon des fonctions de priorité. L'objectif ultime de ces projets d'amélioration est que les processus concernés s'approchent progressivement d'un état où ils sont exempts d'erreur. Naturellement, il pourrait s'agir d'un objectif impossible à atteindre, mais auquel il faut tenter de parvenir. Il n'est pas raisonnable d'espérer obtenir des mesures continues de l'erreur d'enquête totale en se servant de l'erreur quadratique moyenne. Au lieu de cela, on peut espérer qu'une amélioration continue de la qualité par l'application des idées des sciences de la gestion ainsi que des méthodes statistiques permettra de minimiser les biais et d'autres problèmes que posent les processus d'enquête, afin que la variance devienne une approximation de l'erreur quadratique moyenne. Si nous y arrivons, nous aurons fait coïncider approximativement les deux démarches de développement.

    Date de diffusion : 2012-12-19

  • Articles et rapports : 12-001-X201200111680
    Description :

    Les données d'enquête peuvent être falsifiées par les intervieweurs, la fabrication de données étant la forme de falsification la plus flagrante. Même un petit nombre d'interviews contrefaites peuvent fausser gravement les résultats d'analyses empiriques subséquentes. Outre l'exécution de réinterviews, certaines approches statistiques ont été proposées pour repérer ce genre de comportement frauduleux. À l'aide d'un petit ensemble de données, le présent article illustre comment la classification automatique, qui n'est ordinairement pas employée dans ce contexte, pourrait être utilisée pour repérer les intervieweurs qui falsifient les tâches qui leur sont assignées. Plusieurs indicateurs sont combinés pour classer les intervieweurs « à risque » en se fondant uniquement sur les données recueillies. Cette classification multivariée semble supérieure à l'utilisation d'un seul indicateur tel que la loi de Benford.

    Date de diffusion : 2012-06-27

  • Articles et rapports : 82-003-X201200111625
    Géographie : Canada
    Description :

    La présente étude compare les estimations de la prévalence de l'usage de la cigarette fondées sur des données autodéclarées aux estimations fondées sur les concentrations de cotinine urinaire. Les données proviennent de l'Enquête canadienne sur les mesures de la santé réalisée de 2007 à 2009, dans le cadre de laquelle ont été recueillies des données sur la situation d'usage du tabac autodéclarée et effectuées des mesures de la concentration de cotinine urinaire pour la première fois représentatives de la population nationale.

    Date de diffusion : 2012-02-15

  • Articles et rapports : 82-003-X201100111404
    Géographie : Canada
    Description :

    La présente étude vise à évaluer trois échelles de comportement parental déclaré par l'enfant (nurturance, rejet et surveillance) utilisées dans l'Enquête nationale longitudinale sur les enfants et les jeunes.

    Date de diffusion : 2011-02-16

  • Articles et rapports : 82-003-X201000411391
    Géographie : Canada
    Description :

    La présente analyse s'appuie sur des données provenant du module de la cognition de l'Enquête sur la santé dans les collectivités canadiennes - Vieillissement en santé de 2009 pour valider une classification des niveaux de fonctionnement cognitif chez la population à domicile de 45 ans et plus.

    Date de diffusion : 2010-12-15

  • Articles et rapports : 82-003-X201000311288
    Géographie : Canada
    Description :

    Le présent article porte sur l'évaluation de l'association entre l'autoévaluation de la santé mentale et certains troubles mesurés selon la Composite International Diagnostic Interview des World Mental Health Surveys (WMH CIDI), certains diagnostics autodéclarés de troubles mentaux et la détresse psychologique dans la population canadienne.

    Date de diffusion : 2010-07-21

  • Articles et rapports : 12-001-X201000111245
    Description :

    La connaissance des causes des erreurs de mesure dans les enquêtes auprès des entreprises est limitée, même si ces erreurs peuvent compromettre l'exactitude des microdonnées et des indicateurs économiques qui en découlent. Le présent article, qui est fondé sur une étude empirique axée sur le point de vue des entreprises, présente de nouveaux résultats de recherche sur le processus de réponse aux enquêtes auprès des entreprises. Il propose le modèle multidimensionnel intégral de réponse aux enquêtes auprès des entreprises (MMIREE) comme outil pour examiner le processus de réponse et expliquer ses résultats, et comme base d'une stratégie visant à réduire et à prévenir les erreurs de mesure.

    Date de diffusion : 2010-06-29

  • Articles et rapports : 82-003-X201000211234
    Géographie : Canada
    Description :

    Le présent article évalue la sous échelle de l'hyperactivité/inattention de l'Enquête longitudinale nationale sur les enfants et les jeunes à partir des données du cycle 1 (1994 1995) de l'enquête.

    Date de diffusion : 2010-06-16
Références (78)

Références (78) (40 à 50 de 78 résultats)

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015658
    Description :

    Le radon, qui est un gaz dont la présence est observée naturellement dans la plupart des maisons, est un facteur de risque confirmé pour le cancer du poumon chez les humains. Le National Research Council des États-Unis (1999) vient de terminer une évaluation approfondie du risque pour la santé de l'exposition résidentielle au radon, tout en élaborant des modèles de projection du risque de cancer pulmonaire dû au radon pour l'ensemble de la population. Cette analyse indique que le radon joue possiblement un rôle dans l'étiologie de 10-15 % des cas de cancer du poumon aux États-Unis, bien que ces estimations comportent une part appréciable d'incertitude. Les auteurs présentent une analyse partielle de l'incertidude et de la variabilité des estimations du risque de cancer pulmonaire dû à l'exposition résidentielle au radon, aux États-Unis, à l'aide d'un cadre général d'analyse de l'incertitude et de la variabilité établi antérieurement par ces mêmes auteurs. Plus particulièrement, il est question des estimations de l'excès de risque relatif (EFF) par âge et du risque relatif à vie (RRV), qui varient tous deux considérablement d'une personne à l'autre.

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015660
    Description :

    Les situations qui nécessitent le couplage des enregistrements d'un ou de plusieurs fichiers sont très diverses. Dans le cas d'un seul fichier, le but du couplage est de repérer les enregistrements en double. Dans le cas de deux fichiers, il consiste à déceler les unités qui sont les mêmes dans les deux fichiers et donc de créer des paires d'enregistrements correspondants. Souvent, les enregistrements qu'il faut coupler ne contiennent aucun identificateur unique. Le couplage hiérarchique des enregistrements, le couplage probabiliste des enregistrements et l'appariement statistique sont trois méthodes applicables dans ces conditions. Nous décrivons les principales différences entre ces méthodes. Puis, nous discutons du choix des variables d'appariement, de la préparation des fichiers en prévision du couplage et de la façon dont les paires sont reconnues. Nous donnons aussi quelques conseils et quelques trucs utilisés pour coupler des fichiers. Enfin, nous présentons deux exemples : le couplage probabiliste d'enregistrements réalisé dans le cadre de la contre-vérification des données du recensement et le couplage hiérarchique des enregistrements du fichier maître des numéros d'entreprise (NE) à ceux du fichier de l'univers statistique (FUS) d'unités déclarantes non constituées en société (T1).

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015664
    Description :

    La litterature sur la statistique comprend de nombreuses études portant sur les méthodes déterministes, on trouve peu d'information sur ces méthodes. En outre, il semble qu'il n'existe pas d'études qui comparent les résultats obtenus avec les deux méthodes. Or, une telle comparaison serait utile lorsque les seuls indicateurs communs dont on dispose, et à partir desquels les bases de données doivent être couplées, sont des indicateurs indistincts, comme le nom, le sexe et la race. La présente étude compare une méthode de couplage déterministe par étapes avec la méthode probabiliste mise en oeuvre dans AUTOMATCH pour de telles situations. La comparaison porte sur un couplage de données médicales des centres régionaux de soins périnataux intensifs et de données relatives à l'éducation du ministère de l'Éducation de la Floride. Les numéros d'assurance sociale qui figurent dans les deux bases de données ont servi à valider les paires d'enregistrements après le couplage. On compare les taux de correspondance et les taux d'erreur obtenus avec les deux méthodes et on présente une discussion sur les similitudes et les différences entre les méthodes, ainsi que sur les points forts et les points faibles de chacune.

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015666
    Description :

    L'échantillon de fusion obtenu par un procédé d'appariement statistique peut être considéré comme un échantillon tiré d'une population artificielle. Nous dérivons la distribution de cette population artificielle. Si la corrélation entre des variables spécifiques est le seul point d'intérêt, l'importance de l'indépendance conditionnelle peut être réduite. Dans une étude de simulation, nous examinons les effets de la non-confirmation de certaines hypothèses formulées pour obtenir la distribution de la population artificielle. Enfin, nous présentons des idées au sujet de l'établissement de la supposée indépendance conditionnelle par l'analyse de classes latentes.

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015668
    Description :

    À la suite des problèmes d'estimation du sous-dénombrement qu'a posé le Recensement de l'Angleterre et du Pays de Galles de 1991, on s'est fixé comme objectif pour le Recensement de 2001 de créer une base de données entièrement corrigée pour tenir compte du sous-dénombrement net. Dans la présente communication, on examine l'application d'une méthode d'imputation pondérée par donneur qui se fonde sur des renseignements provenant tant du recensement que de l'Enquête sur la couverture du recensement (ECR). Le US Census Bureau envisage une approche similaire pour le Recensement des États-Unis de l'an 2000 (voir Isaki et coll. 1998). La méthode proposée fait la distinction entre les personnes qui ne sont pas dénombrées lors du recensement parce qu'on a manqué leur ménage et celles qui ne sont pas dénombrées dans les ménages qui ont été recensés. Les données de recensement sont couplées aux données de l'ECR. On utilise la régression logistique multinominale pour estimer la probabilité que des ménages soient omis dans le recensement, ainsi que la probabilité que des personnes ne soient pas dénombrées au sein de ménages recensés. On calcule des poids de couverture pour les ménages et pour les personnes d'après les probabilités estimatives, puis on les inègre à la méthode d'imputation par donneur.

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015670
    Description :

    Pour atteindre efficacement leur public cible, les publicistes et les planificateurs des médias ont besoin de savoir quel pourcentage de consommateurs de Coke diète regardent Alerte à Malibu, ou combien de clients d'AT&T ont vu une annonce de Sprint au cours de la dernière semaine. Toutes les données pertinentes pourraient en théorie être recueillies auprès de chacun des répondants. Toutefois, la collecte de données précises et détaillées serait très coûteuse. Elle imposerait en outre un fardeau important aux répondants, compte tenu de la technique de collecte utilisée actuellement. Pour le moment, ces donées sont recueillies dans le cadre d'enquêtes distinctes, en Nouvelle-Zélande et dans nombre d'autres pays. Le niveau d'exposition aux principaux médias est mesuré de façon continue, et les études sur l'utilisation des produits sont répandues. Des techniques d'appariement statistique fournissent une façon de combiner ces sources d'information distinctes. La base de données des cotes d'écoute de la télévision en Nouvelle-Zélande a été combinée à une enquête multi-intérêts portant sur le profit des lecteurs d'imprimés et la consommation de produits, grâce à l'appariement statistique. Le service Panorama qui en résulte répond aux besoins d'information des publicistes et des planificateurs des médias. L'expérience a été reprise depuis en Australie. Le présent document porte sur l'élaboration du cadre d'appariement statistique qui a servi à la combinaison de ces bases de données, ainsi que sur les connaissances heuristiques et les techniques qui ont été utilisées. Celles-ci comprenaient notamment une expérience effectuée au moyen d'un plan de contrôle visant à déterminer les variables d'appariement importantes. Le présent document comprend en outre un résumé des études ayant servi à l'évaluation et à la validation des résultats combinés. Trois critères principaux d'évaluation ont été utilisés, à savoir : la précision des résultats combinés, la stabilité de ces résultats et la préservation des résultats des bases de données originales. On aborde aussi la façon dont les conditions préalables à la combinaison de ces bases de données ont été respectées. Les différences entre les techniques d'analyse utilisées dans les deux bases de données d'origine ont constitué l'obstacle le plus important à cette étape. Enfin, des suggestions pour le de'veloppement de systèmes d'appariement statistique similaires ailleurs sont fournis.

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015672
    Description :

    La fusion des données qui est examinée ici consiste à créer un ensemble de données provenant de sources différentes sur des variables que l'on n'observe pas conjointement. Supposons par exemple que l'on dispose d'observations pour (X,Z) sur un ensemble de personnes et pour (Y,Z) sur un autre ensemble de personnes. Chacune des variables X, Y et Z peut être vectorielle. L'objectif principal consiste à obtenir des précisions sur la distribution conjointe de (X,Y) en se servant de Z comme ce que l'on conviendra d'appeler variable d'appariement. Toutefois, on s'efforce d'abord d'extraire des ensembles de données distincts autant de renseignements que possible sur la distribution conjointe de (X,Y,Z). On ne peut procéder à ce genre de fusion que moyennant la précision de certaines propriétés distributionnelles pour les données fusionnées, à savoir l'hypothèse d'indépendance conditionnelle étant donné les variables d'appariement. Classiquement, l'examen des variables fusionnées consiste à déterminer dans quelle mesure cette hypothèse sous-jacente est appropriée. Ici, nous examinons le problème sous un angle différent. La question que nous nous posons est celle de savoir comment il est possible d'estimer des distributions dans des situations où l'on ne dispose que d'observations provenant de certaines distributions marginales. Nous pouvons la résoudre en appliquant le critère d'entropie maximale. Nous montrons notamment qu'il est possible d'interpréter les données créés par fusion de données de sources différentes comme un cas spécial de cette situation. Par conséquent, nous dérivons l'hypothèse nécessaire d'indépendance conditionnelle en tant que conséquence du type de données disponibles.

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015674
    Description :

    L'influence de l'environnement sur la santé est un sujet de préoccupation croissante, plus particulièrement les effets de l'émission de polluants industriels dans l'atmosphère, le sol et l'eau. L'évaluation des risques que comporte une source de pollution donnée pour la santé publique est souvent effectuée à l'aide de données démographiques, environementales et relatives à la santé qui sont recueillies couramment par des organismes gouvernementaux. Ces ensembles de données présentent des différences d'échantillonnage notables sur les plans géographique et temporel; ces différences se répercutent sur les analyses épidémiologiques qui utilisent conjointement de tels ensembles. Au Royaumi-Uni, les problèmes de santé sont enregistrés individuellement pour chaque personne. Sont également indiqués le code de cause de maladie, la date du diagnostic ou du décès, et en utilisant le code postal de l'unité comme référence géographique. Par contre, les données démographiques relatives aux petites régions sont enregistrées uniquement lors du recensement décennal et sont diffusés comme données de niveau régional dans des zones qui ne correspondent pas à celles des codes postaux. Des données relatives à l'exposition ambiante sont pourtant disponibles à un autre niveau, selon le type d'exposition et la source des mesures.

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015678
    Description :

    Un modèle d'affectation des ressources en matière de soins de santé selon les besoins de la population a été conçu et mis en application, l'âge, le sexe et l'état de santé des habitants ayant été utilisés pour évaluer les besoins de la population ontarienne en matière de soins de santé. Pour élaborer ce modèle, on a combiné les données provinciales sur l'autoévaluation de la santé et de l'utilisation des services de santé, selon l'âge et le sexe, obtenues auprès de 62 413 répondants de l'Enquête sur la santé en Ontario (ESO) de 1990 et les données sur les dépenses provinciales en soins de santé pour l'exercice 1995-1996, selon l'âge et le sexe. Ce modèle ne comprenait que les services visés par l'ESO (omnipraticiens, médecins spécialistes, optométrie, physiothérapie, chiropractie et soins de courte durée). La répartition de l'utilisation et des dépenses entre les diverses catégories d'âge, de sexe et d'état de santé a été utilisée pour établir les proportions appropriées de ressources en matière de soins de santé pour chaque combinaison âge-sexe-état de santé. Ces proportions ont par la suite été appliquées aux populations des régions géographiques, à partir des données sur l'âge, le sexe et l'état de santé provenant de l'ESO, ainsi que des estimations plus récentes de la population, afin de déterminer les affectations pour chaque région. Le total de ces affectations en dollars devait correspondre au montant du budget provincial de 1995-1996. Les affectations ainsi calculées ont été comparées à celles de 1995-1996 pour déterminer dans quelle mesure elles étaient effectivement compatibles avec les besoins relatifs de la population des régions de l'Ontario.

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015680
    Description :

    La combinaison de bases de données par des méthodes de couplage d'enregistrements en vue d'augmenter la quantité d'information disponible est un phénomène de plus en plus fréquent. Si l'on ne peut se fonder sur aucun identificateur unique pour procéder à l'appariement des enregistrements, on recourt au couplage probabiliste. On apparie un enregistrement du premier fichier à un enregistrement du deuxième avec une certaine probabilité et on décide ensuite si cette paire d'enregistrements représente ou non un appariement vrai. Habituellement, ce processus nécessite une certaine intervention manuelle qui demande du temps et des ressources humaines. En outre, il aboutit souvent à un couplage complexe. Autrement dit, au lieu d'être systématiquement biunivoque (un à un), le couplage entre les deux bases de données peut être multi-univoque (plusieurs à un), co-univoque (un à plusieurs) ou multivoque (plusieurs à plusieurs).

    Date de diffusion : 2000-03-02
Date de modification :