Recherche par mot-clé
Filtrer les résultats par
Aide à la rechercheMot(s)-clé(s)
Sujet
Type
Résultats
Tout (7)
Tout (7) ((7 résultats))
- Articles et rapports : 12-001-X201300111826Description :
Il est courant que les organismes d'enquête fournissent des poids de rééchantillonnage dans les fichiers de données d'enquête. Ces poids de rééchantillonnage servent à produire de manière simple et systématique des estimations valides et efficaces de la variance pour divers estimateurs. Cependant, la plupart des méthodes existantes de construction de poids de rééchantillonnage ne sont valides que pour des plans d'échantillonnage particuliers et nécessitent habituellement un très grand nombre de répliques. Dans le présent article, nous montrons d'abord comment produire les poids de rééchantillonnage en se basant sur la méthode décrite dans Fay (1984) de manière que l'estimateur de la variance par rééchantillonnage résultant soit algébriquement équivalent à l'estimateur de la variance par linéarisation entièrement efficace pour tout plan d'échantillonnage donné. Puis, nous proposons une nouvelle méthode de calage des poids afin que l'estimation soit simultanément efficace et parcimonieuse au sens où un petit nombre de jeux de poids de rééchantillonnage peuvent produire des estimateurs de la variance par rééchantillonnage valides et efficaces pour les paramètres de population importants. La méthode que nous proposons peut être conjuguée aux méthodes de rééchantillonnage existantes pour les enquêtes complexes à grande échelle. Nous discutons également de la validité des méthodes proposées et de leur extension à certains plans d'échantillonnage équilibrés. Les résultats de simulations montrent que les estimateurs de variance que nous proposons suivent très bien les probabilités de couverture des intervalles de confiance. Les stratégies que nous proposons auront vraisemblablement des répercussions sur la façon de produire les fichiers de données d'enquête à grande diffusion et d'analyser ces ensembles de données.
Date de diffusion : 2013-06-28 - Articles et rapports : 11-522-X200600110431Description :
Nous décrivons ici les méthodes de contrôle de la divulgation statistique (CDS) mises au point pour la diffusion publique du fichier de microdonnées du Système canadien hospitalier d'information et de recherche en prévention des traumatismes (SCHIRPT). Le SCHIRPT est une base de données nationale de surveillance des blessures administrée par l'Agence de santé publique du Canada (ASPC). Après une description du SCHIRPT, nous présentons un bref aperçu des concepts de base du CDS en guise d'introduction à la procédure de sélection et d'élaboration des méthodes de CDS applicables au SCHIRPT, compte tenu des défis et des besoins particuliers qui sont associés à ce système. Nous résumons ensuite quelques-uns des principaux résultats. Le présent article se conclut par une discussion sur les répercussions de ces travaux sur le domaine de l'information en matière de santé et des observations finales sur certaines questions méthodologiques qu'il convient d'examiner.
Date de diffusion : 2008-03-17 - Articles et rapports : 11-522-X200600110433Description :
Le processus de création de fichiers de microdonnées à grande diffusion compte un certain nombre de composantes. L'un de ses éléments clés est la méthode novatrice MASSC mise au point par RTI International. Cependant, ce processus comporte d'autres composantes importantes, comme le traitement des variables d'identification non essentielles et des résultats extrêmes en guise de protection supplémentaire. Le contrôle de la divulgation statistique a pour but de contrer l'intrusion interne ainsi qu'externe. Les composantes du processus sont conçues en conséquence.
Date de diffusion : 2008-03-17 - Articles et rapports : 11-522-X200600110434Description :
La protection contre la divulgation de l'identité des répondants dans les données d'enquête publiées constitue un enjeu d'ordre pratique pour de nombreux organismes gouvernementaux. Parmi les méthodes de protection figurent la suppression des identificateurs de grappe et de strate, de même que la modification des données ou la permutation des valeurs entre les enregistrements des répondants. Malheureusement, les identificateurs de grappe et de strate sont généralement nécessaires à l'estimation de la variance axée sur la linéarisation ainsi qu'aux méthodes de répétition, dans la mesure où le rééchantillonnage porte habituellement sur les unités de sondage du premier degré dans les strates. On pourrait penser que la diffusion d'un ensemble de poids de rééchantillonnage duquel les identificateurs de strate et de grappe auraient été supprimés permettrait de régler une partie du problème, particulièrement si l'on fait appel à une méthode de rééchantillonnage aléatoire, comme celle du bootstrap. Dans le présent article, nous démontrons dans un premier temps que, en considérant les poids de rééchantillonnage comme des observations dans un espace dimensionnel de haut niveau, on peut facilement utiliser un algorithme de mise en grappes pour reconstruire les identificateurs de grappe, peu importe la méthode de rééchantillonnage, même si les poids de rééchantillonnage ont été modifiés aléatoirement. Nous proposons ensuite un algorithme rapide qui permet de permuter les identificateurs de grappe et de strate des unités finales avant la création des poids de rééchantillonnage, sans influer de façon significative sur les estimations de la variance des caractéristiques visées qui en résultent. Ces méthodes sont illustrées par leur application aux données publiées issues des National Health and Nutrition Examination Surveys, enquêtes pour lesquelles les questions de divulgation sont extrêmement importantes.
Date de diffusion : 2008-03-17 - Articles et rapports : 11-522-X20050019438Description :
Au cours des ans, une variété de normes ont vu le jour pour documenter les contenus de fichiers de données, chacune à ses fins particulières. La norme DDI (Data Documentation Initiative) est un standard technique de documentation basé sur le format XML.
Date de diffusion : 2007-03-02 - Enquêtes et programmes statistiques — Documentation : 75F0002M199303ADescription :
Ce document vise à fournir une vue d'ensemble de la stratégie proposée pour les fichiers de microdonnées longitudinales de l'Enquête sur la dynamique du travail et du revenu (EDTR).
Date de diffusion : 1995-12-30 - 7. Fichiers de microdonnées de l'EDTR : proposition de contenu - Partie B : spécifications détaillées ArchivéEnquêtes et programmes statistiques — Documentation : 75F0002M199303BDescription :
Dans ce document, on présente des renseignements détaillés sur les diverses variables spécifiques liées aux fichiers de microdonnées de l'Enquête sur la dynamique du travail et du revenu (EDTR).
Date de diffusion : 1995-12-30
Données (0)
Données (0) (0 résultat)
Aucun contenu disponible actuellement
Analyses (5)
Analyses (5) ((5 résultats))
- Articles et rapports : 12-001-X201300111826Description :
Il est courant que les organismes d'enquête fournissent des poids de rééchantillonnage dans les fichiers de données d'enquête. Ces poids de rééchantillonnage servent à produire de manière simple et systématique des estimations valides et efficaces de la variance pour divers estimateurs. Cependant, la plupart des méthodes existantes de construction de poids de rééchantillonnage ne sont valides que pour des plans d'échantillonnage particuliers et nécessitent habituellement un très grand nombre de répliques. Dans le présent article, nous montrons d'abord comment produire les poids de rééchantillonnage en se basant sur la méthode décrite dans Fay (1984) de manière que l'estimateur de la variance par rééchantillonnage résultant soit algébriquement équivalent à l'estimateur de la variance par linéarisation entièrement efficace pour tout plan d'échantillonnage donné. Puis, nous proposons une nouvelle méthode de calage des poids afin que l'estimation soit simultanément efficace et parcimonieuse au sens où un petit nombre de jeux de poids de rééchantillonnage peuvent produire des estimateurs de la variance par rééchantillonnage valides et efficaces pour les paramètres de population importants. La méthode que nous proposons peut être conjuguée aux méthodes de rééchantillonnage existantes pour les enquêtes complexes à grande échelle. Nous discutons également de la validité des méthodes proposées et de leur extension à certains plans d'échantillonnage équilibrés. Les résultats de simulations montrent que les estimateurs de variance que nous proposons suivent très bien les probabilités de couverture des intervalles de confiance. Les stratégies que nous proposons auront vraisemblablement des répercussions sur la façon de produire les fichiers de données d'enquête à grande diffusion et d'analyser ces ensembles de données.
Date de diffusion : 2013-06-28 - Articles et rapports : 11-522-X200600110431Description :
Nous décrivons ici les méthodes de contrôle de la divulgation statistique (CDS) mises au point pour la diffusion publique du fichier de microdonnées du Système canadien hospitalier d'information et de recherche en prévention des traumatismes (SCHIRPT). Le SCHIRPT est une base de données nationale de surveillance des blessures administrée par l'Agence de santé publique du Canada (ASPC). Après une description du SCHIRPT, nous présentons un bref aperçu des concepts de base du CDS en guise d'introduction à la procédure de sélection et d'élaboration des méthodes de CDS applicables au SCHIRPT, compte tenu des défis et des besoins particuliers qui sont associés à ce système. Nous résumons ensuite quelques-uns des principaux résultats. Le présent article se conclut par une discussion sur les répercussions de ces travaux sur le domaine de l'information en matière de santé et des observations finales sur certaines questions méthodologiques qu'il convient d'examiner.
Date de diffusion : 2008-03-17 - Articles et rapports : 11-522-X200600110433Description :
Le processus de création de fichiers de microdonnées à grande diffusion compte un certain nombre de composantes. L'un de ses éléments clés est la méthode novatrice MASSC mise au point par RTI International. Cependant, ce processus comporte d'autres composantes importantes, comme le traitement des variables d'identification non essentielles et des résultats extrêmes en guise de protection supplémentaire. Le contrôle de la divulgation statistique a pour but de contrer l'intrusion interne ainsi qu'externe. Les composantes du processus sont conçues en conséquence.
Date de diffusion : 2008-03-17 - Articles et rapports : 11-522-X200600110434Description :
La protection contre la divulgation de l'identité des répondants dans les données d'enquête publiées constitue un enjeu d'ordre pratique pour de nombreux organismes gouvernementaux. Parmi les méthodes de protection figurent la suppression des identificateurs de grappe et de strate, de même que la modification des données ou la permutation des valeurs entre les enregistrements des répondants. Malheureusement, les identificateurs de grappe et de strate sont généralement nécessaires à l'estimation de la variance axée sur la linéarisation ainsi qu'aux méthodes de répétition, dans la mesure où le rééchantillonnage porte habituellement sur les unités de sondage du premier degré dans les strates. On pourrait penser que la diffusion d'un ensemble de poids de rééchantillonnage duquel les identificateurs de strate et de grappe auraient été supprimés permettrait de régler une partie du problème, particulièrement si l'on fait appel à une méthode de rééchantillonnage aléatoire, comme celle du bootstrap. Dans le présent article, nous démontrons dans un premier temps que, en considérant les poids de rééchantillonnage comme des observations dans un espace dimensionnel de haut niveau, on peut facilement utiliser un algorithme de mise en grappes pour reconstruire les identificateurs de grappe, peu importe la méthode de rééchantillonnage, même si les poids de rééchantillonnage ont été modifiés aléatoirement. Nous proposons ensuite un algorithme rapide qui permet de permuter les identificateurs de grappe et de strate des unités finales avant la création des poids de rééchantillonnage, sans influer de façon significative sur les estimations de la variance des caractéristiques visées qui en résultent. Ces méthodes sont illustrées par leur application aux données publiées issues des National Health and Nutrition Examination Surveys, enquêtes pour lesquelles les questions de divulgation sont extrêmement importantes.
Date de diffusion : 2008-03-17 - Articles et rapports : 11-522-X20050019438Description :
Au cours des ans, une variété de normes ont vu le jour pour documenter les contenus de fichiers de données, chacune à ses fins particulières. La norme DDI (Data Documentation Initiative) est un standard technique de documentation basé sur le format XML.
Date de diffusion : 2007-03-02
Références (2)
Références (2) ((2 résultats))
- Enquêtes et programmes statistiques — Documentation : 75F0002M199303ADescription :
Ce document vise à fournir une vue d'ensemble de la stratégie proposée pour les fichiers de microdonnées longitudinales de l'Enquête sur la dynamique du travail et du revenu (EDTR).
Date de diffusion : 1995-12-30 - 2. Fichiers de microdonnées de l'EDTR : proposition de contenu - Partie B : spécifications détaillées ArchivéEnquêtes et programmes statistiques — Documentation : 75F0002M199303BDescription :
Dans ce document, on présente des renseignements détaillés sur les diverses variables spécifiques liées aux fichiers de microdonnées de l'Enquête sur la dynamique du travail et du revenu (EDTR).
Date de diffusion : 1995-12-30
- Date de modification :