Recherche par mot-clé

Aller au contenu principal
Aller au pied de page

Sélection de la langue

English

Recherche et menus

Recherche et menus

Rechercher

Résultats

Tout (23)

Tout (23) (10 à 20 de 23 résultats)

11. Méthodologie d'évaluation de la qualité du couplage probabiliste Archivé
Articles et rapports : 11-522-X200600110401
Description :
L'Australian Bureau of Statistics (ABS) entamera la création d'un ensemble de données statistiques longitudinales de recensement (EDSLR) en sélectionnant un échantillon de 5 % de personnes provenant de la population du Recensement de 2006 en vue de le coupler de manière probabiliste aux données des futurs recensements. L'un des objectifs à long terme est de profiter de la force des riches données démographiques longitudinales fournies par l'EDSLR pour offrir des éclaircissements sur diverses questions qui ne peuvent être résolues à l'aide de données transversales. L'EDSLR pourrait être amélioré par couplage probabiliste avec les données sur les naissances, les décès et l'immigration, ainsi qu'avec celles des registres des maladies. Le présent article décrit brièvement les progrès récents dans le domaine du couplage des données à l'ABS, expose les grandes lignes, la méthodologie de couplage des données et les mesures de la qualité qui ont été envisagées et résume les résultats provisoires à l'aide des données du test du recensement.
Date de diffusion : 2008-03-17
12. Appariement de données régionales du recensement avec des données d'enquête et des données administratives Archivé
Articles et rapports : 11-522-X200600110402
Description :
Dans cet article, nous expliquons comment joindre les données sommaires du recensement par région à des données d'enquête ou à des données administratives. Nous citons des exemples d'ensembles de données présents dans les Centres de données de recherche de Statistique Canada, mais les méthodes valent aussi pour des ensembles extérieurs, notamment les ensembles de données administratives. À l'aide de quatre exemples, nous illustrons des situations courantes dans lesquelles se trouvent les chercheurs : (1) cas où les données d'enquête (ou les données administratives) et les données du recensement contiennent des identificateurs géographiques de même niveau et sont codés selon la même année de référence du découpage géographique aux fins du recensement (par exemple, si les deux ont des données 2001 AD); (2) cas où les deux fichiers contiennent des identificateurs géographiques pour la même année de référence, mais pour des niveaux différents de découpage géographique du recensement (par exemple, 1996 SD dans l'enquête, mais 1996 SR dans les données du recensement); (3) cas où les deux fichiers contiennent des données codées pour des années de référence différentes de géographie telles que 1996 SD pour l'enquête, mais 2001 AD pour le recensement); (4) cas où les données d'enquête n'ont pas d'identificateurs géographiques, ceux-ci devant d'abord être produits à partir des codes postaux du fichier d'enquête. Ces exemples sont présentés en syntaxe SAS, mais les principes s'appliquent à d'autres langages de programmation ou progiciels statistiques.
Date de diffusion : 2008-03-17
13. Couplage d'enregistrements déterministe et probabiliste Archivé
Articles et rapports : 11-522-X200600110404
Description :
Les efforts des programmes d'enquête en vue de réduire les coûts et le fardeau de réponse se sont traduits par une utilisation croissante de l'information disponible dans les bases de données administratives. Le couplage des données provenant de ces deux sources est un moyen d'exploiter leur nature complémentaire et de maximiser leur utilité respective. Le présent article décrit diverses méthodes suivies pour procéder au couplage des enregistrements des bases de données de l'Enquête sur la santé dans les collectivités canadiennes (ESCC) et de l'Information santé orientée vers la personne (ISOP). Les fichiers résultant de certaines de ces méthodes de couplage sont utilisés pour analyser les facteurs de risque d'hospitalisation pour une maladie cardiaque. La sensibilité de l'analyse est évaluée en fonction des diverses approches de couplage.
Date de diffusion : 2008-03-17
14. Combinaison de renseignements provenant de deux enquêtes pour améliorer l'analyse des données autodéclarées utilisées pour estimer les mesures de la santé Archivé
Articles et rapports : 11-522-X200600110408
Description :
Malgré les progrès réalisés en vue d'améliorer la santé de la population des États Unis, des disparités en matière de santé persistent entre divers groupes raciaux/ethniques et socioéconomiques. Les sources habituelles de données pour évaluer la santé d'une population d'intérêt comprennent les enquêtes à grande échelle, qui contiennent souvent des questions à réponse autodéclarée, comme « Un médecin ou un autre professionnel de la santé vous a t-il déjà dit que vous souffrez de problème de santé d'intérêt ? Les réponses à de telles questions pourraient ne pas refléter la prévalence réelle des problèmes de santé (p. ex., si le répondant n'a pas accès à un médecin ou à un autre professionnel de la santé). De même, les renseignements autodéclarés concernant des données quantitatives telles que la taille et le poids pourraient être entachés d'erreurs de déclaration. Ce genre d'« erreurs de mesure » dans les données sur la santé pourraient avoir une incidence sur les inférences relatives aux mesures de la santé et aux disparités en matière de santé. Dans la présente étude, nous ajustons des modèles d'erreur de mesure aux données de la National Health and Nutrition Examination Survey, qui comprend un volet d'interview durant lequel sont posées des questions à réponse autodéclarée et un volet d'examen durant lequel sont obtenues des mesures physiques. Puis, nous élaborons des méthodes permettant d'utiliser les modèles ajustés pour améliorer l'analyse des données autodéclarées provenant d'une autre enquête ne comportant pas de volet d'examen. Enfin, nous appliquons ces méthodes, qui comportent l'imputation multiples de valeurs fondées sur les données recueillies par examen à l'enquête ne produisant que des données autodéclarées, à la National Health Interview Survey dans des exemples ayant trait au diabète, à l'hypertension et à l'obésité. Les résultats préliminaires laissent entendre que les ajustements pour l'erreur de mesure peuvent causer des variations non négligeables des estimations des mesures de la santé.
Date de diffusion : 2008-03-17
15. Évaluation des méthodes de détection et de traitement des valeurs aberrantes dans « Survey of Occupational Illnesses and Injuries » des États-Unis Archivé
Articles et rapports : 11-522-X200600110410
Description :
Survey of Occupational Illnesses and Injuries (SOII) des États Unis est une enquête à grande échelle effectuée auprès des établissements et réalisée par le Bureau of Labor Statistics. Elle a pour but de mesurer les taux d'incidence et les conséquences des maladies et des blessures professionnelles dans certaines industries à l'échelle du pays et de l'État. À l'heure actuelle, cette enquête s'appuie sur des méthodes relativement simples pour la détection et le traitement des valeurs aberrantes. Les méthodes de détection des valeurs aberrantes reposent sur la comparaison des taux d'incidence déclarés en ce qui concerne l'établissement à la distribution correspondante des déclarations dans des cellules particulières définies par le croisement des classifications selon l'État et selon l'industrie. Les méthodes de traitement comportent le remplacement des poids probabilistes type par un poids dont la valeur est fixée à un, suivi par un étalonnage.
Des méthodes plus complexes pourraient être utilisées pour la détection et le traitement des valeurs aberrantes dans la SOII, par exemple des méthodes de détection qui s'appuient sur des fonctions d'influence, des poids probabilistes et des observations multivariées, ou des méthodes de traitement fondées sur la winsorisation ou l'estimation M. L'évaluation des avantages pratiques de ces méthodes plus complexes nécessite la prise en considération de trois facteurs importants. Premièrement, les valeurs très extrêmes sont relativement rares, mais lorsqu'elles se produisent, elles peuvent avoir un effet important sur les estimateurs de la SOII dans les cellules définies par le croisement des États et des industries. Par conséquent, l'évaluation pratique de l'effet des méthodes de détection des valeurs aberrantes se concentre principalement sur les queues des distributions des estimateurs, plutôt que sur les mesures de performance agrégées normalisées, comme la variance ou l'erreur quadratique moyenne. Deuxièmement, les évaluations analytiques et fondées sur des données sont axées sur l'amélioration progressive obtenue grâce à l'utilisation de méthodes plus complexes, comparativement aux résultats produits par les méthodes simples suivies à l'heure actuelle. Troisièmement, l'élaboration des outils susmentionnés nécessite le recours à une théorie asymptotique qui n'est pas tout à fait standard pour refléter les compromis en ce qui a trait aux effets associés à, respectivement, l'accroissement de la taille des échantillons, l'accroissement du nombre de cellules pour la publication et l'évolution des queues des distributions sous jacentes des observations.
Date de diffusion : 2008-03-17
16. La combinaison de cycles de l'Enquête sur la santé dans les collectivités canadiennes Archivé
Articles et rapports : 11-522-X200600110411
Description :
L'Enquête sur la santé dans les collectivités canadiennes comporte deux enquêtes transversales menées en alternance sur un cycle annuel. Les deux enquêtes recueillent des renseignements généraux sur la santé; la deuxième, de moindre envergure, recueille des renseignements supplémentaires sur des aspects précis de la santé. Même si la taille des échantillons est importante, les utilisateurs sont intéressés à combiner les cycles de l'ESCC afin d'améliorer la qualité des estimations et de produire des estimations pour les petits domaines géographiques ou pour des caractéristiques ou des populations rares. Le présent document porte sur certains enjeux liés à la combinaison des cycles de l'ESCC, dont les interprétations possibles du résultat combiné, ainsi que sur certaines méthodes de combinaison des cycles.
Date de diffusion : 2008-03-17
17. Masquage dans le cas de variables discrètes Archivé
Articles et rapports : 11-522-X200600110432
Description :
L'utilisation de variables discrètes ayant une distribution statistique connue pour le masquage des données de variables discrètes est à l'étude depuis un certain temps. Le présent article fait état de quelques-uns de nos résultats de recherche sur le sujet. Les conséquences du prélèvement, dans des populations finies, d'échantillons avec et sans remise suscitent un intérêt tout particulier. Les estimations des moments de premier ordre et de second ordre qui permettent d'atténuer ou de corriger la variation supplémentaire causée par le masquage d'un type connu sont établies. L'incidence du masquage des données originales sur la structure de corrélation de variables discrètes faisant l'objet de mesures concomitantes est examinée, et la nécessité d'un examen plus poussé des résultats à des fins d'analyse des données multivariées est discutée.
Date de diffusion : 2008-03-17
18. Méthodes pour les données binaires longitudinales avec observations manquantes Archivé
Articles et rapports : 11-522-X20050019474
Description :
Les données manquantes sont une caractéristique fréquente des études longitudinales. Ces dernières années, de nombreuses études ont été consacrées à la mise au point de méthodes d'analyse des données longitudinales incomplètes. Une pratique courante est l'imputation par « report de la dernière observation » (RDO), selon laquelle les valeurs pour les réponses manquantes sont imputées en se servant des observations provenant de l'évaluation complétée la plus récente. La communication débutera par un examen de la performance de l'approche RDO, lorsque des équations d'estimation généralisées (EEG) sont employées comme méthode d'inférence.
Date de diffusion : 2007-03-02
19. Dans ce numéro (Vol. 32, no 1) Archivé
Articles et rapports : 12-001-X20060019266
Description :
La rubrique Dans ce numéro contient une brève présentation par le rédacteur en chef de chacun des articles contenus dans le présent numéro de Techniques d'enquête. Aussi, on y trouve parfois quelques commentaires sur des changements dans la structure ou la gestion de la revue.
Date de diffusion : 2006-07-20
20. Dans ce numéro (Vol. 25, no. 1) Archivé
Articles et rapports : 12-001-X199900111395
Description :
La rubrique Dans ce numéro contient une brève présentation par le rédacteur en chef de chacun des articles contenus dans le présent numéro de Techniques d'enquête. Aussi, on y trouve parfois quelques commentaires sur des changements dans la structure ou la gestion de la revue.
Date de diffusion : 1999-10-08

Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (22)

Analyses (22) (0 à 10 de 22 résultats)

1. Une approche bayésienne approximative pour améliorer les estimateurs d’un échantillon probabiliste à l’aide d’un échantillon non probabiliste supplémentaire Archivé
Articles et rapports : 11-522-X202100100008
Description :
Les organismes nationaux de statistique étudient de plus en plus la possibilité d'utiliser des échantillons non probabilistes en complément des échantillons probabilistes. Nous examinons le scénario où la variable d’intérêt et les variables auxiliaires sont observées à la fois dans un échantillon probabiliste et un échantillon non probabiliste. Nous cherchons à utiliser les données de l’échantillon non probabiliste pour améliorer l’efficacité des estimations pondérées par les poids d’enquête obtenues à partir de l’échantillon probabiliste. Récemment, Sakshaug, Wisniowski, Ruiz et Blom (2019) et Wisniowski, Sakshaug, Ruiz et Blom (2020) ont proposé une approche bayésienne visant à intégrer les données des deux échantillons aux fins de l’estimation des paramètres du modèle. Dans leur méthode, on utilise les données de l’échantillon non probabiliste pour déterminer la distribution a priori des paramètres du modèle et on obtient la distribution a posteriori en supposant que le plan de sondage probabiliste est ignorable (ou non informatif). Nous étendons cette approche bayésienne à la prédiction de paramètres d’une population finie dans le cadre d’un échantillonnage non ignorable (ou informatif) en nous appuyant sur des statistiques pondérées par des poids d’enquête appropriées. Nous illustrons les propriétés de notre prédicteur au moyen d’une étude par simulations.
Mots clés : prédiction bayésienne; échantillonnage de Gibbs; échantillonnage non ignorable; intégration des données statistiques.

Date de diffusion : 2021-10-29
2. Une évaluation des données d’enquêtes non probabilistes en ligne : comparaison de l’enquête au moyen de l’application mobile Carotte Points Santé et de l’Enquête sur la santé dans les collectivités canadiennes Archivé
Articles et rapports : 11-633-X2019002
Description :
La collecte de données d’enquête au moyen des appareils mobiles, comme les tablettes électroniques et les téléphones intelligents, a fait son apparition au Canada. Cependant, on en sait peu au sujet de la représentativité des données recueillies au moyen de ces appareils. En mars 2017, Statistique Canada a commandé une collecte de données d’enquête par l’intermédiaire de l’application Carotte Points Santé et a inclus 11 questions dans l’enquête réalisée sur l’application mobile Carotte Points Santé (Carotte) tirées de l’Enquête sur la santé dans les collectivités canadiennes (ESCC) de 2017.
Date de diffusion : 2019-06-04
3. Propriétés théoriques et empiriques d’estimateurs par la régression fondés sur un test de décision assistés par modèle Archivé
Articles et rapports : 12-001-X201400114004
Description :
En 2009, deux enquêtes importantes réalisées par la division des administrations publiques du U.S. Census Bureau ont été remaniées afin de réduire la taille de l’échantillon, d’économiser des ressources et d’améliorer la précision des estimations (Cheng, Corcoran, Barth et Hogue 2009). Sous le nouveau plan de sondage, chaque strate habituelle, définie par l’État et le type d’administration publique, qui contient un nombre suffisant d’unités (administrations publiques) est divisée en deux sous strates en fonction de la masse salariale totale de chaque unité afin de tirer un plus petit échantillon de la sous strate des unités de petite taille. L’approche assistée par modèle est adoptée pour estimer les totaux de population. Des estimateurs par la régression utilisant des variables auxiliaires sont obtenus soit pour chaque sous strate ainsi créée soit pour la strate originale en regroupant des deux sous strates. Cheng, Slud et Hogue (2010) ont proposé une méthode fondée sur un test de décision qui consiste à appliquer un test d’hypothèse pour décider quel estimateur par la régression sera utilisé pour chaque strate originale. La convergence et la normalité asymptotique de ces estimateurs assistés par modèle sont établies ici sous un cadre asymptotique fondé sur le plan de sondage ou assisté par modèle. Nos résultats asymptotiques suggèrent aussi deux types d’estimateurs de variance convergents, l’un obtenu par substitution des quantités inconnues dans les variances asymptotiques et l’autre en appliquant la méthode du bootstrap. La performance de tous les estimateurs des totaux et des estimateurs de leur variance est examinée au moyen d’études empiriques. L’Annual Survey of Public Employment and Payroll (ASPEP) des États Unis est utilisé pour motiver et illustrer notre étude.
Date de diffusion : 2014-06-27
4. Dans ce numéro (Vol. 35, no. 2) Archivé
Articles et rapports : 12-001-X200900211056
Description :
La rubrique Dans ce numéro contient une brève présentation par le rédacteur en chef de chacun des articles contenus dans le présent numéro de Techniques d'enquête. Aussi, on y trouve parfois quelques commentaires sur des changements dans la structure ou la gestion de la revue.
Date de diffusion : 2009-12-23
5. Dans ce numéro (Vol. 35, no. 1) Archivé
Articles et rapports : 12-001-X200900110892
Description :
La rubrique Dans ce numéro contient une brève présentation par le rédacteur en chef de chacun des articles contenus dans le présent numéro de Techniques d'enquête. Aussi, on y trouve parfois quelques commentaires sur des changements dans la structure ou la gestion de la revue.
Date de diffusion : 2009-06-22
6. Construction personnalisée des données de durée : un exemple de dérivation des variables de l'assurance-chômage à l'aide de SPSS Archivé
Articles et rapports : 12-002-X200900110693
Description :
Composé au départ pour la recherche de l'auteur sur l'assurance-chômage (AC), cet article résume une série de procédures qui permettent une construction personnalisée de données de durée, à l'aide du logiciel SPSS et de l'Enquête sur la dynamique du travail et du revenu (EDTR). Ces procédures peuvent servir à fusionner, déduire ou faire correspondre plusieurs ensembles de données liés à la durée.
Date de diffusion : 2009-04-22
7. Combiner les cycles de l'Enquête sur la santé dans les collectivités canadiennes Archivé
Articles et rapports : 82-003-X200900110795
Géographie : Canada
Description :
Cet article décrit des méthodes de combinaison des divers cycles de l'Enquête sur la santé dans les collectivités canadiennes et discute des problèmes dont il convient de tenir compte si ces données sont combinées.
Date de diffusion : 2009-02-18
8. Masquage des unités primaires d'échantillonnage (UPE) et estimation de la variance dans les enquêtes complexes Archivé
Articles et rapports : 12-001-X200800210759
Description :
L'analyse des données recueillies auprès d'un échantillon stratifié à plusieurs degrés requiert de l'information sur le plan de sondage, telle que les identificateurs de strate et d'unité primaire d'échantillonnage (UPE), ou les poids de rééchantillonnage connexes, pour l'estimation de la variance. Dans certains fichiers de données à grande diffusion, l'information sur le plan de sondage est masquée en vue d'éviter le risque de divulgation, tout en permettant à l'utilisateur d'obtenir des estimations valides des variances. Par exemple, dans le cas des enquêtes aréolaires comptant un nombre limité d'UPE, les UPE originales sont divisées et (ou) recombinées pour construire des pseudo UPE dans lesquelles sont permutées les unités d'échantillonnage de deuxième degré et de degré subséquent. Cependant, ces méthodes de masquage des UPE faussent manifestement la structure de mise en grappes du plan d'échantillonnage, ce qui donne des estimations de variance biaisées pouvant présenter un rapport systématique entre les deux estimations de variance obtenues avec et sans masquage des identificateurs d'UPE. Certains travaux antérieurs ont révélé certaines tendances du ratio des estimations de la variance obtenues avec et sans masquage si on représente ce ratio graphiquement en fonction de l'effet de plan sans masquage. Le présent article traite de l'effet du masquage des UPE sur les estimations de la variance sous échantillonnage en grappes en fonction de divers aspects, dont la structure de mise en grappes et le degré de masquage. En outre, nous tâchons d'établir une stratégie de masquage des UPE par permutation des unités d'échantillonnage du degré subséquent qui réduit le biais résultant des estimations de la variance. En guise d'illustration, nous utilisons des données provenant de la National Health Interview Survey (NHIS) auxquelles nous avons apporté certaines modifications artificielles. La stratégie proposée permet de bien réduire le biais des estimations de la variance. Les résultats tant théoriques qu'empiriques indiquent que l'effet du masquage des UPE sur les estimations de la variance est modeste si la permutation des unités d'échantillonnage de degré subséquent est minimale. Nous avons appliqué la stratégie de masquage proposée aux données diffusées de la National Health and Nutrition Examination Survey (NHANES) de 2003 2004.
Date de diffusion : 2008-12-23
9. Dans ce numéro (Vol. 34, no. 1) Archivé
Articles et rapports : 12-001-X200800110642
Description :
La rubrique Dans ce numéro contient une brève présentation par le rédacteur en chef de chacun des articles contenus dans le présent numéro de Techniques d'enquête. Aussi, on y trouve parfois quelques commentaires sur des changements dans la structure ou la gestion de la revue.
Date de diffusion : 2008-06-26
10. Méthodologie d'évaluation de la qualité du couplage probabiliste Archivé
Articles et rapports : 11-522-X200600110401
Description :
L'Australian Bureau of Statistics (ABS) entamera la création d'un ensemble de données statistiques longitudinales de recensement (EDSLR) en sélectionnant un échantillon de 5 % de personnes provenant de la population du Recensement de 2006 en vue de le coupler de manière probabiliste aux données des futurs recensements. L'un des objectifs à long terme est de profiter de la force des riches données démographiques longitudinales fournies par l'EDSLR pour offrir des éclaircissements sur diverses questions qui ne peuvent être résolues à l'aide de données transversales. L'EDSLR pourrait être amélioré par couplage probabiliste avec les données sur les naissances, les décès et l'immigration, ainsi qu'avec celles des registres des maladies. Le présent article décrit brièvement les progrès récents dans le domaine du couplage des données à l'ABS, expose les grandes lignes, la méthodologie de couplage des données et les mesures de la qualité qui ont été envisagées et résume les résultats provisoires à l'aide des données du test du recensement.
Date de diffusion : 2008-03-17

Références (1)

Références (1) ((1 résultat))

1. Méthodologie des tables de mortalité pour le Canada, les provinces et les territoires
Enquêtes et programmes statistiques — Documentation : 84-538-X
Géographie : Canada
Description : Cette publication électronique présente la méthodologie sous-jacente à la production des tables de mortalité pour le Canada, les provinces et les territoires.
Date de diffusion : 2023-08-28

Signaler un problème ou une erreur sur cette page

Date de modification :: 2024-11-09

Comment utiliser les filtres et le champ de recherche

Vous pouvez faire une recherche en inscrivant des mots-clés ou en sélectionnant des filtres (p. ex. sous Sujet, Géographie, etc.) du côté gauche de la page.
On peut utiliser les filtres ensemble ou former diverses combinaisons. À chaque sélection de filtre, la page des résultats est mise à jour.
Pour commencer une nouvelle recherche, cliquez sur le bouton Effacer tout au-dessus du champ de recherche ou décochez tous les filtres.
Les mots-clés et les filtres précisés sont affichés au-dessus du champ de recherche. Vous pouvez désélectionner l’un ou l’autre des éléments ou tous les éléments, pour préciser ou effacer votre recherche.

Comment préciser ma recherche

Vous pouvez entrer des mots-clés dans le champ de recherche. Il n’est pas nécessaire d’utiliser « + » ou « , » ou « ET ».
Vous pouvez supprimer certains mots-clés ou tous les mots-clés de votre chaîne de recherche.
Les mots-clés entre guillemets limitent la recherche à l’expression précise.
- Par exemple, si vous cherchez « Enquête sur la population active », vous obtiendrez seulement des documents contenant cette suite de mots.
Utilisez « ou » entre les mots-clés pour obtenir des résultats qui contiennent au moins l’un des termes recherchés.
- Par exemple, si vous cherchez enquête ou population ou active, vous obtiendrez seulement les documents contenant l’un ou l’autre de ces mots, ou tous ces mots.

Comment fonctionne la recherche

Cette forme de recherche fournira les résultats contenant le(s) mot(s) inscrit(s) dans le titre, la description, le sujet, la géographie, le numéro de produit ou toute autre information au sujet du produit.
- Par exemple, lorsque vous cherchez le mot « maladies », tous les résultats obtenus contiendront ce mot dans le titre, la description, ou le sujet.
La recherche ne se fait pas dans le texte des articles ou des publications. Pour faire une recherche plein texte dans les articles, utilisez la fonction de recherche du site.