Assurance de la qualité

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Géographie

2 facets displayed. 0 facets selected.

Contenu

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (250)

Tout (250) (240 à 250 de 250 résultats)

  • Enquêtes et programmes statistiques — Documentation : 75F0002M1995007
    Description :

    Dans ce document, on décrit l'incidence de l'interview assistée par ordinateur (IAO) sur la qualité des données de l'Enquête sur la dynamique du travail et du revenu (EDTR) dans trois domaines : l'activité sur le marché du travail, les sources de revenu dont la divulgation pose un problème aux répondants, et les relations au sein du ménage.

    Date de diffusion : 1995-12-30

  • Articles et rapports : 12-001-X199400214420
    Description :

    De nombreuses méthodes de protection du caractère confidentiel des microdonnées sont décrites dans les ouvrages de statistique. Cependant, l’usage qu’en font les organismes statistiques et la compréhension qu’on a de leurs propriétés et de leurs effets sont limités. Afin de favoriser la recherche sur ces méthodes ainsi que leur usage et pour faciliter leur évaluation et l’assurance de la qualité, il est souhaitable de formuler ces méthodes selon une seule approche. Dans cet article, nous présentons une approche appelée masquage de matrice - qui repose sur le calcul matriciel ordinaire - et nous formulons des masques de matrice pour les principales méthodes de protection du caractère confidentiel de microdonnées actuellement en usage, ce qui permettra aux organismes statistiques et aux autres spécialistes du domaine d’avoir une meilleure compréhension de ces méthodes et de les mettre en application.

    Date de diffusion : 1994-12-15

  • Articles et rapports : 12-001-X199300214456
    Description :

    Cette étude est basée sur l’utilisation de modèles de superpopulation pour anticiper la variance d’une mesure par sondage de ratios avant l’enquête. On arrive, en utilisant des modèles simples qu’on voudrait néanmoins assez réalistes, à des expressions plus ou moins complexes qu’on parvient à optimiser, parfois rigoureusement, quelquefois de façon approximative. La solution du dernier des problèmes évoqués fait apparaître un facteur assez peu étudié en matière d’optimisation de plan de sondage : le coût lié à la mobilisation d’une information individuelle.

    Date de diffusion : 1993-12-15

  • Articles et rapports : 75-001-X19890032282
    Géographie : Canada
    Description :

    L'indice de l'offre d'emploi évalue les offres d'emploi en vue d'obtenir une indication de la demande de main-d'oeuvre. L'indice est considéré comme un indicateur avancé des conditions du marché du travail et de l'activité économique en général. L'étude porte sur les variations de l'indice au cours des trois derniers cycles conjoncturels.

    Date de diffusion : 1989-09-30

  • Articles et rapports : 12-001-X198900114573
    Description :

    Aux fins de son programme de la statistique économique, le Census Bureau fait grande utilisation des dossiers administratifs. Le nombre de dossiers traités chaque année est considérable, mais il l’est encore plus durant les années de recensement. Pour assurer la qualité de toutes les données qu’il reçoit, le Census Bureau a mis au point des programmes de contrôle sur gros ordinateur. Toutefois, étant donné le très grand nombre de tableaux de vérification requis, et compte tenu du fait que les ressources nécessaires à la programmation sont limitées et coûteuses, il serait difficile d’adopter un système exhaustif de contrôle exploité entièrement sur gros ordinateur. En outre, vu le caractère confidentiel des données et les conséquences possibles des erreurs, le Census Bureau a conclu qu’il fallait mettre au point un système de contrôle plus « sophistiqué », qui s’appuie sur la technologie des micro-ordinateurs. La division des enquêtes économiques est en train de mettre au point un tel système qui sera utilisé pour traiter les fichiers de données administratives de 1987. Le système intègre la technologie des gros ordinateurs à celle des micro-ordinateurs. Les fichiers de données administratives qui arrivent chaque semaine au Bureau sont d’abord traitées sur gros ordinateur. Les données ainsi traitées sont transférées sur micro-ordinateur et sont formatées pour être exploitées par un tableur. La vérification systématique de la qualité des données (examen de données, détection des erreurs, production de rapports) est faite sur micro-ordinateur, par le tableur. L’utilisation combinée d’un gros ordinateur et de micro-ordinateurs permet d’alléger la charge des programmeurs, de faciliter le travail des analystes (plus de souplesse) et de réduire les coûts du traitement sur gros ordinateur. Enfin, la composante « contrôle-vérification » du système assure une vérification rigoureuse et exhaustive des données.

    Date de diffusion : 1989-06-15

  • Articles et rapports : 12-001-X198900114576
    Description :

    Une des principales tâches des agents sanitaires en poste dans les pays en voie de développement est de vérifier si une population répond à certaines normes, par exemple la proportion d’habitants vaccinés contre une certaine maladie. Comme les populations sont généralement nombreuses et que les ressources et le temps nécessaires à des études sont limités, on doit habituellement procéder par échantillonnage et établir des estimations pour la population toute entière. Selon la proportion de personnes non vaccinées dans l’échantillon, on déterminera si la couverture vaccinale est acceptable ou s’il y a lieu d’accentuer les efforts pour accroître cette couverture. Plusieurs méthodes d’échantillonnage sont actuellement en usage. Parmi celles-ci figure une version modifiée de la méthode d’échantillonnage en grappes, recommandée par le Programme élargi de vaccination (PEV) de l’Organisation mondiale de la Santé. Plus récemment, on a suggéré que l’assurance de la qualité par échantillonnage (AQE), une méthode couramment utilisée dans l’inspection des produits manufacturés, pourrait être utile au suivi des programmes de santé. Dans cet article, nous décrivons la méthode AQE et donnons un exemple d’application.

    Date de diffusion : 1989-06-15

  • Articles et rapports : 12-001-X198800214585
    Description :

    Les méthodes servant à contrôler la qualité des opérations d’enquête à Statistique Canada consistent habituellement en un échantillonnage pour acceptation pour chaque caractéristique, accompagné d’une inspection de redressement, l’une et l’autre opération s’inscrivant dans le cadre plus général du contrôle d’acceptation. Bien que ces méthodes soient considérées comme de bonnes mesures correctives, elles sont peu efficaces pour empêcher une répétition des erreurs. Vu l’importance primordiale de cet aspect de la gestion de la qualité, le Système de gestion de la qualité (SGQ) a été conçu en fonction de plusieurs objectifs dont la prévention des erreurs est un des principaux. C’est pourquoi il sert à produire des rapports de contrôle et des graphiques à l’intention des opérateurs, superviseurs et gestionnaires chargés des diverses opérations. Il sert également à produire des données sur les changements survenus au chapitre de l’inspection et permet ainsi aux méthodologistes de réviser les plans et les méthodes d’inspection en conformité avec les grandes lignes du contrôle d’acceptation. Cet article expose les principales caractéristiques du SGQ au point de vue de l’estimation et de la totalisation des données et montre de quelle façon ce système dessert les principaux programmes de contrôle de la qualité à Statistique Canada. Des fonctions importantes sont également analysées du point de vue méthodologique et systémique.

    Date de diffusion : 1988-12-15

  • Articles et rapports : 12-001-X198400214356
    Description :

    Cette étude décrit l’utilisation de l’appariement de fichiers de données comparables dans l’évaluation de l’erreur non due à l’échantillonnage. Pour illustrer cette technique, on explique comment la qualité des données du recensement de l’agriculture de 1981 au Canada a été évaluée et on présente quelques résultats de cette analyse.

    Date de diffusion : 1984-12-14

  • Articles et rapports : 12-001-X198300114334
    Description :

    Depuis 1921, Statistique Canada, organisme central de regroupement de statistiques au Canada, compile des données sur la mortalité à l’échelle nationale, notamment celles qui touchent la mortalité due au cancer. Il dispose également de données sur l’incidence du cancer qui remontent à 1969.

    On peut évaluer de diverses façons la qualité des données de ces fichiers. Les rapports entre la mortalité due au cancer et l’incidence de cette maladie donnent certaines indications sur les erreurs de représentation. L’appariement des micro-données entre les fichiers « incidence » et « mortalité » donnent un aperçu des erreurs de classification. De même, les inscriptions multiples de l’incidence du cancer posent le problème du double emploi. Par ailleurs, l’intégralité et la disponibilité des données élémentaires revêtent de l’importance dans le cas d’études spéciale.

    Dans cet article, nous étudions la possibilité de nous servir de ces mesures de la qualité des données et les conséquences que peuvent avoir les mesures en question.

    Date de diffusion : 1983-06-15

  • Articles et rapports : 12-001-X198100154933
    Description :

    La coordination est un aspect des enquêtes auquel on n’accorde pas toujours suffisamment d’attention.

    Les auteurs analysent l’envergure et l’importance de la coordination des enquêtes et préconisent une approche méthodologique plus scientifique. Des applications pratiques à diverses étapes des enquêtes sont illustrées par des exemples tirés de l’Enquête sur la population active du Canada.

    Date de diffusion : 1981-06-15
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (171)

Analyses (171) (30 à 40 de 171 résultats)

  • Articles et rapports : 11F0019M2013351
    Géographie : Canada
    Description :

    Les mesures du bien être subjectif occupent une place de plus en plus importante dans les discussions stratégiques qui se tiennent à l'échelle internationale concernant la question de savoir quel est le meilleur moyen de mesurer le « progrès sociétal » et le bien être des populations nationales. Ce point a des conséquences pour les organismes statistiques nationaux, car on leur demande d'incorporer à leurs enquêtes ménages des mesures du bien être subjectif (Organisation de coopération et de développement économiques, 2013). Cela fait 25 ans que Statistique Canada incorpore à ses enquêtes des mesures du bien être subjectif - particulièrement la satisfaction à l'égard de la vie - quoique le libellé des questions et les catégories de réponses aient évolué avec le temps. Ainsi, l'Enquête sociale générale (ESG) et l'Enquête sur la santé dans les collectivités canadiennes (ESCC) de Statistique Canada fournissent une bonne occasion de procéder à un examen de la stabilité des réponses aux questions sur la satisfaction à l'égard de la vie et de leurs corrélats au fil des ans à l'intérieur d'un cadre analytique cohérent.

    Date de diffusion : 2013-10-11

  • Articles et rapports : 82-003-X201300811857
    Géographie : Canada
    Description :

    À partir des données du Registre canadien du cancer, de la statistique de l'état civil et de statistiques sur la population, la présente étude examine l'hypothèse de ratios de taux d'incidence et de mortalité normalisés selon l'âge et propres au sexe et au siège du cancer stables d'une région à l'autre, qui sous tend l'indicateur de la complétude de la détermination des cas de la North American Association of Central Cancer Registries (NAACCR).

    Date de diffusion : 2013-08-21

  • Articles et rapports : 12-001-X201200211751
    Description :

    La qualité des enquêtes est un concept multidimensionnel issu de deux démarches de développement distinctes. La première démarche suit le paradigme de l'erreur d'enquête totale, qui repose sur quatre piliers dont émanent les principes qui guident la conception de l'enquête, sa mise en oeuvre, son évaluation et l'analyse des données. Nous devons concevoir les enquêtes de façon que l'erreur quadratique moyenne d'une estimation soit minimisée compte tenu du budget et d'autres contraintes. Il est important de tenir compte de toutes les sources connues d'erreur, de surveiller les principales d'entre elles durant la mise en oeuvre, d'évaluer périodiquement les principales sources d'erreur et les combinaisons de ces sources après l'achèvement de l'enquête, et d'étudier les effets des erreurs sur l'analyse des données. Dans ce contexte, on peut mesurer la qualité d'une enquête par l'erreur quadratique moyenne, la contrôler par des observations faites durant la mise en oeuvre et l'améliorer par des études d'évaluation. Le paradigme possède des points forts et des points faibles. L'un des points forts tient au fait que la recherche peut être définie en fonction des sources d'erreur et l'un des points faibles, au fait que la plupart des évaluations de l'erreur d'enquête totale sont incomplètes, en ce sens qu'il est impossible d'inclure les effets de toutes les sources. La deuxième démarche est influencée par des idées empruntées aux sciences de la gestion de la qualité. Ces sciences ont pour objet de permettre aux entreprises d'exceller dans la fourniture de produits et de services en se concentrant sur leurs clients et sur la concurrence. Ces idées ont eu une très grande influence sur de nombreux organismes statistiques. Elles ont notamment amené les fournisseurs de données à reconnaître qu'un produit de qualité ne peut pas être obtenu si la qualité des processus sous-jacents n'est pas suffisante et que des processus de qualité suffisante ne peuvent pas être obtenus sans une bonne qualité organisationnelle. Ces divers niveaux peuvent être contrôlés et évalués au moyen d'ententes sur le niveau de service, de sondages auprès des clients, d'analyses des paradonnées en recourant au contrôle statistique des processus et d'évaluations organisationnelles en se servant de modèles d'excellence opérationnelle ou d'autres ensembles de critères. À tous les niveaux, on peut rehausser la qualité en lançant des projets d'amélioration choisis selon des fonctions de priorité. L'objectif ultime de ces projets d'amélioration est que les processus concernés s'approchent progressivement d'un état où ils sont exempts d'erreur. Naturellement, il pourrait s'agir d'un objectif impossible à atteindre, mais auquel il faut tenter de parvenir. Il n'est pas raisonnable d'espérer obtenir des mesures continues de l'erreur d'enquête totale en se servant de l'erreur quadratique moyenne. Au lieu de cela, on peut espérer qu'une amélioration continue de la qualité par l'application des idées des sciences de la gestion ainsi que des méthodes statistiques permettra de minimiser les biais et d'autres problèmes que posent les processus d'enquête, afin que la variance devienne une approximation de l'erreur quadratique moyenne. Si nous y arrivons, nous aurons fait coïncider approximativement les deux démarches de développement.

    Date de diffusion : 2012-12-19

  • Articles et rapports : 12-001-X201200111680
    Description :

    Les données d'enquête peuvent être falsifiées par les intervieweurs, la fabrication de données étant la forme de falsification la plus flagrante. Même un petit nombre d'interviews contrefaites peuvent fausser gravement les résultats d'analyses empiriques subséquentes. Outre l'exécution de réinterviews, certaines approches statistiques ont été proposées pour repérer ce genre de comportement frauduleux. À l'aide d'un petit ensemble de données, le présent article illustre comment la classification automatique, qui n'est ordinairement pas employée dans ce contexte, pourrait être utilisée pour repérer les intervieweurs qui falsifient les tâches qui leur sont assignées. Plusieurs indicateurs sont combinés pour classer les intervieweurs « à risque » en se fondant uniquement sur les données recueillies. Cette classification multivariée semble supérieure à l'utilisation d'un seul indicateur tel que la loi de Benford.

    Date de diffusion : 2012-06-27

  • Articles et rapports : 82-003-X201200111625
    Géographie : Canada
    Description :

    La présente étude compare les estimations de la prévalence de l'usage de la cigarette fondées sur des données autodéclarées aux estimations fondées sur les concentrations de cotinine urinaire. Les données proviennent de l'Enquête canadienne sur les mesures de la santé réalisée de 2007 à 2009, dans le cadre de laquelle ont été recueillies des données sur la situation d'usage du tabac autodéclarée et effectuées des mesures de la concentration de cotinine urinaire pour la première fois représentatives de la population nationale.

    Date de diffusion : 2012-02-15

  • Articles et rapports : 82-003-X201100111404
    Géographie : Canada
    Description :

    La présente étude vise à évaluer trois échelles de comportement parental déclaré par l'enfant (nurturance, rejet et surveillance) utilisées dans l'Enquête nationale longitudinale sur les enfants et les jeunes.

    Date de diffusion : 2011-02-16

  • Articles et rapports : 82-003-X201000411391
    Géographie : Canada
    Description :

    La présente analyse s'appuie sur des données provenant du module de la cognition de l'Enquête sur la santé dans les collectivités canadiennes - Vieillissement en santé de 2009 pour valider une classification des niveaux de fonctionnement cognitif chez la population à domicile de 45 ans et plus.

    Date de diffusion : 2010-12-15

  • Articles et rapports : 82-003-X201000311288
    Géographie : Canada
    Description :

    Le présent article porte sur l'évaluation de l'association entre l'autoévaluation de la santé mentale et certains troubles mesurés selon la Composite International Diagnostic Interview des World Mental Health Surveys (WMH CIDI), certains diagnostics autodéclarés de troubles mentaux et la détresse psychologique dans la population canadienne.

    Date de diffusion : 2010-07-21

  • Articles et rapports : 12-001-X201000111245
    Description :

    La connaissance des causes des erreurs de mesure dans les enquêtes auprès des entreprises est limitée, même si ces erreurs peuvent compromettre l'exactitude des microdonnées et des indicateurs économiques qui en découlent. Le présent article, qui est fondé sur une étude empirique axée sur le point de vue des entreprises, présente de nouveaux résultats de recherche sur le processus de réponse aux enquêtes auprès des entreprises. Il propose le modèle multidimensionnel intégral de réponse aux enquêtes auprès des entreprises (MMIREE) comme outil pour examiner le processus de réponse et expliquer ses résultats, et comme base d'une stratégie visant à réduire et à prévenir les erreurs de mesure.

    Date de diffusion : 2010-06-29

  • Articles et rapports : 82-003-X201000211234
    Géographie : Canada
    Description :

    Le présent article évalue la sous échelle de l'hyperactivité/inattention de l'Enquête longitudinale nationale sur les enfants et les jeunes à partir des données du cycle 1 (1994 1995) de l'enquête.

    Date de diffusion : 2010-06-16
Références (78)

Références (78) (40 à 50 de 78 résultats)

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015658
    Description :

    Le radon, qui est un gaz dont la présence est observée naturellement dans la plupart des maisons, est un facteur de risque confirmé pour le cancer du poumon chez les humains. Le National Research Council des États-Unis (1999) vient de terminer une évaluation approfondie du risque pour la santé de l'exposition résidentielle au radon, tout en élaborant des modèles de projection du risque de cancer pulmonaire dû au radon pour l'ensemble de la population. Cette analyse indique que le radon joue possiblement un rôle dans l'étiologie de 10-15 % des cas de cancer du poumon aux États-Unis, bien que ces estimations comportent une part appréciable d'incertitude. Les auteurs présentent une analyse partielle de l'incertidude et de la variabilité des estimations du risque de cancer pulmonaire dû à l'exposition résidentielle au radon, aux États-Unis, à l'aide d'un cadre général d'analyse de l'incertitude et de la variabilité établi antérieurement par ces mêmes auteurs. Plus particulièrement, il est question des estimations de l'excès de risque relatif (EFF) par âge et du risque relatif à vie (RRV), qui varient tous deux considérablement d'une personne à l'autre.

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015660
    Description :

    Les situations qui nécessitent le couplage des enregistrements d'un ou de plusieurs fichiers sont très diverses. Dans le cas d'un seul fichier, le but du couplage est de repérer les enregistrements en double. Dans le cas de deux fichiers, il consiste à déceler les unités qui sont les mêmes dans les deux fichiers et donc de créer des paires d'enregistrements correspondants. Souvent, les enregistrements qu'il faut coupler ne contiennent aucun identificateur unique. Le couplage hiérarchique des enregistrements, le couplage probabiliste des enregistrements et l'appariement statistique sont trois méthodes applicables dans ces conditions. Nous décrivons les principales différences entre ces méthodes. Puis, nous discutons du choix des variables d'appariement, de la préparation des fichiers en prévision du couplage et de la façon dont les paires sont reconnues. Nous donnons aussi quelques conseils et quelques trucs utilisés pour coupler des fichiers. Enfin, nous présentons deux exemples : le couplage probabiliste d'enregistrements réalisé dans le cadre de la contre-vérification des données du recensement et le couplage hiérarchique des enregistrements du fichier maître des numéros d'entreprise (NE) à ceux du fichier de l'univers statistique (FUS) d'unités déclarantes non constituées en société (T1).

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015664
    Description :

    La litterature sur la statistique comprend de nombreuses études portant sur les méthodes déterministes, on trouve peu d'information sur ces méthodes. En outre, il semble qu'il n'existe pas d'études qui comparent les résultats obtenus avec les deux méthodes. Or, une telle comparaison serait utile lorsque les seuls indicateurs communs dont on dispose, et à partir desquels les bases de données doivent être couplées, sont des indicateurs indistincts, comme le nom, le sexe et la race. La présente étude compare une méthode de couplage déterministe par étapes avec la méthode probabiliste mise en oeuvre dans AUTOMATCH pour de telles situations. La comparaison porte sur un couplage de données médicales des centres régionaux de soins périnataux intensifs et de données relatives à l'éducation du ministère de l'Éducation de la Floride. Les numéros d'assurance sociale qui figurent dans les deux bases de données ont servi à valider les paires d'enregistrements après le couplage. On compare les taux de correspondance et les taux d'erreur obtenus avec les deux méthodes et on présente une discussion sur les similitudes et les différences entre les méthodes, ainsi que sur les points forts et les points faibles de chacune.

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015666
    Description :

    L'échantillon de fusion obtenu par un procédé d'appariement statistique peut être considéré comme un échantillon tiré d'une population artificielle. Nous dérivons la distribution de cette population artificielle. Si la corrélation entre des variables spécifiques est le seul point d'intérêt, l'importance de l'indépendance conditionnelle peut être réduite. Dans une étude de simulation, nous examinons les effets de la non-confirmation de certaines hypothèses formulées pour obtenir la distribution de la population artificielle. Enfin, nous présentons des idées au sujet de l'établissement de la supposée indépendance conditionnelle par l'analyse de classes latentes.

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015668
    Description :

    À la suite des problèmes d'estimation du sous-dénombrement qu'a posé le Recensement de l'Angleterre et du Pays de Galles de 1991, on s'est fixé comme objectif pour le Recensement de 2001 de créer une base de données entièrement corrigée pour tenir compte du sous-dénombrement net. Dans la présente communication, on examine l'application d'une méthode d'imputation pondérée par donneur qui se fonde sur des renseignements provenant tant du recensement que de l'Enquête sur la couverture du recensement (ECR). Le US Census Bureau envisage une approche similaire pour le Recensement des États-Unis de l'an 2000 (voir Isaki et coll. 1998). La méthode proposée fait la distinction entre les personnes qui ne sont pas dénombrées lors du recensement parce qu'on a manqué leur ménage et celles qui ne sont pas dénombrées dans les ménages qui ont été recensés. Les données de recensement sont couplées aux données de l'ECR. On utilise la régression logistique multinominale pour estimer la probabilité que des ménages soient omis dans le recensement, ainsi que la probabilité que des personnes ne soient pas dénombrées au sein de ménages recensés. On calcule des poids de couverture pour les ménages et pour les personnes d'après les probabilités estimatives, puis on les inègre à la méthode d'imputation par donneur.

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015670
    Description :

    Pour atteindre efficacement leur public cible, les publicistes et les planificateurs des médias ont besoin de savoir quel pourcentage de consommateurs de Coke diète regardent Alerte à Malibu, ou combien de clients d'AT&T ont vu une annonce de Sprint au cours de la dernière semaine. Toutes les données pertinentes pourraient en théorie être recueillies auprès de chacun des répondants. Toutefois, la collecte de données précises et détaillées serait très coûteuse. Elle imposerait en outre un fardeau important aux répondants, compte tenu de la technique de collecte utilisée actuellement. Pour le moment, ces donées sont recueillies dans le cadre d'enquêtes distinctes, en Nouvelle-Zélande et dans nombre d'autres pays. Le niveau d'exposition aux principaux médias est mesuré de façon continue, et les études sur l'utilisation des produits sont répandues. Des techniques d'appariement statistique fournissent une façon de combiner ces sources d'information distinctes. La base de données des cotes d'écoute de la télévision en Nouvelle-Zélande a été combinée à une enquête multi-intérêts portant sur le profit des lecteurs d'imprimés et la consommation de produits, grâce à l'appariement statistique. Le service Panorama qui en résulte répond aux besoins d'information des publicistes et des planificateurs des médias. L'expérience a été reprise depuis en Australie. Le présent document porte sur l'élaboration du cadre d'appariement statistique qui a servi à la combinaison de ces bases de données, ainsi que sur les connaissances heuristiques et les techniques qui ont été utilisées. Celles-ci comprenaient notamment une expérience effectuée au moyen d'un plan de contrôle visant à déterminer les variables d'appariement importantes. Le présent document comprend en outre un résumé des études ayant servi à l'évaluation et à la validation des résultats combinés. Trois critères principaux d'évaluation ont été utilisés, à savoir : la précision des résultats combinés, la stabilité de ces résultats et la préservation des résultats des bases de données originales. On aborde aussi la façon dont les conditions préalables à la combinaison de ces bases de données ont été respectées. Les différences entre les techniques d'analyse utilisées dans les deux bases de données d'origine ont constitué l'obstacle le plus important à cette étape. Enfin, des suggestions pour le de'veloppement de systèmes d'appariement statistique similaires ailleurs sont fournis.

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015672
    Description :

    La fusion des données qui est examinée ici consiste à créer un ensemble de données provenant de sources différentes sur des variables que l'on n'observe pas conjointement. Supposons par exemple que l'on dispose d'observations pour (X,Z) sur un ensemble de personnes et pour (Y,Z) sur un autre ensemble de personnes. Chacune des variables X, Y et Z peut être vectorielle. L'objectif principal consiste à obtenir des précisions sur la distribution conjointe de (X,Y) en se servant de Z comme ce que l'on conviendra d'appeler variable d'appariement. Toutefois, on s'efforce d'abord d'extraire des ensembles de données distincts autant de renseignements que possible sur la distribution conjointe de (X,Y,Z). On ne peut procéder à ce genre de fusion que moyennant la précision de certaines propriétés distributionnelles pour les données fusionnées, à savoir l'hypothèse d'indépendance conditionnelle étant donné les variables d'appariement. Classiquement, l'examen des variables fusionnées consiste à déterminer dans quelle mesure cette hypothèse sous-jacente est appropriée. Ici, nous examinons le problème sous un angle différent. La question que nous nous posons est celle de savoir comment il est possible d'estimer des distributions dans des situations où l'on ne dispose que d'observations provenant de certaines distributions marginales. Nous pouvons la résoudre en appliquant le critère d'entropie maximale. Nous montrons notamment qu'il est possible d'interpréter les données créés par fusion de données de sources différentes comme un cas spécial de cette situation. Par conséquent, nous dérivons l'hypothèse nécessaire d'indépendance conditionnelle en tant que conséquence du type de données disponibles.

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015674
    Description :

    L'influence de l'environnement sur la santé est un sujet de préoccupation croissante, plus particulièrement les effets de l'émission de polluants industriels dans l'atmosphère, le sol et l'eau. L'évaluation des risques que comporte une source de pollution donnée pour la santé publique est souvent effectuée à l'aide de données démographiques, environementales et relatives à la santé qui sont recueillies couramment par des organismes gouvernementaux. Ces ensembles de données présentent des différences d'échantillonnage notables sur les plans géographique et temporel; ces différences se répercutent sur les analyses épidémiologiques qui utilisent conjointement de tels ensembles. Au Royaumi-Uni, les problèmes de santé sont enregistrés individuellement pour chaque personne. Sont également indiqués le code de cause de maladie, la date du diagnostic ou du décès, et en utilisant le code postal de l'unité comme référence géographique. Par contre, les données démographiques relatives aux petites régions sont enregistrées uniquement lors du recensement décennal et sont diffusés comme données de niveau régional dans des zones qui ne correspondent pas à celles des codes postaux. Des données relatives à l'exposition ambiante sont pourtant disponibles à un autre niveau, selon le type d'exposition et la source des mesures.

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015678
    Description :

    Un modèle d'affectation des ressources en matière de soins de santé selon les besoins de la population a été conçu et mis en application, l'âge, le sexe et l'état de santé des habitants ayant été utilisés pour évaluer les besoins de la population ontarienne en matière de soins de santé. Pour élaborer ce modèle, on a combiné les données provinciales sur l'autoévaluation de la santé et de l'utilisation des services de santé, selon l'âge et le sexe, obtenues auprès de 62 413 répondants de l'Enquête sur la santé en Ontario (ESO) de 1990 et les données sur les dépenses provinciales en soins de santé pour l'exercice 1995-1996, selon l'âge et le sexe. Ce modèle ne comprenait que les services visés par l'ESO (omnipraticiens, médecins spécialistes, optométrie, physiothérapie, chiropractie et soins de courte durée). La répartition de l'utilisation et des dépenses entre les diverses catégories d'âge, de sexe et d'état de santé a été utilisée pour établir les proportions appropriées de ressources en matière de soins de santé pour chaque combinaison âge-sexe-état de santé. Ces proportions ont par la suite été appliquées aux populations des régions géographiques, à partir des données sur l'âge, le sexe et l'état de santé provenant de l'ESO, ainsi que des estimations plus récentes de la population, afin de déterminer les affectations pour chaque région. Le total de ces affectations en dollars devait correspondre au montant du budget provincial de 1995-1996. Les affectations ainsi calculées ont été comparées à celles de 1995-1996 pour déterminer dans quelle mesure elles étaient effectivement compatibles avec les besoins relatifs de la population des régions de l'Ontario.

    Date de diffusion : 2000-03-02

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015680
    Description :

    La combinaison de bases de données par des méthodes de couplage d'enregistrements en vue d'augmenter la quantité d'information disponible est un phénomène de plus en plus fréquent. Si l'on ne peut se fonder sur aucun identificateur unique pour procéder à l'appariement des enregistrements, on recourt au couplage probabiliste. On apparie un enregistrement du premier fichier à un enregistrement du deuxième avec une certaine probabilité et on décide ensuite si cette paire d'enregistrements représente ou non un appariement vrai. Habituellement, ce processus nécessite une certaine intervention manuelle qui demande du temps et des ressources humaines. En outre, il aboutit souvent à un couplage complexe. Autrement dit, au lieu d'être systématiquement biunivoque (un à un), le couplage entre les deux bases de données peut être multi-univoque (plusieurs à un), co-univoque (un à plusieurs) ou multivoque (plusieurs à plusieurs).

    Date de diffusion : 2000-03-02
Date de modification :