Aide à l'ordre
entrées

Résultats

Tout (22)

Tout (22) (0 à 10 de 22 résultats)

  • Articles et rapports : 82-003-X202301200002
    Description : La validité des estimations de la survie fondées sur les données des registres du cancer découle en partie du repérage des décès de personnes atteintes de cancer. Les personnes dont le décès n’est pas repéré semblent vivre éternellement et sont informellement appelées « immortelles ». Leur présence dans les données des registres peut entraîner des estimations de survie exagérées. L’étude évalue l’enjeu des immortels dans le Registre canadien du cancer au moyen d’une méthode proposée qui permet de comparer la survie des survivants à long terme du cancer pour lesquels un remède « statistique » a été déclaré avec celle d’autres personnes similaires issues de la population générale.
    Date de diffusion : 2023-12-20

  • Articles et rapports : 11-633-X2023003
    Description : Ce document couvre les travaux universitaires et les stratégies d’estimation utilisées par les organismes nationaux de statistique. Il aborde la question de la production d’estimations géographiques détaillées au niveau du quadrillage pour le Canada en étudiant la mesure du produit intérieur brut infraprovincial et infraterritorial à l’aide du Yukon comme scénario d’essai.
    Date de diffusion : 2023-12-15

  • Articles et rapports : 45-20-00022023004
    Description : L'analyse comparative entre les sexes plus (ACS Plus) est un outil analytique développé par Femmes et Égalité des genres Canada (FEGC) pour soutenir l'élaboration d'initiatives réactives et inclusives, telles que des politiques, des programmes et d'autres initiatives. Cette fiche d'information présente l'utilité de l’ACS Plus pour la désagrégation et l'analyse des données afin d'identifier les groupes les plus touchés par certains enjeux, comme la surqualification.
    Date de diffusion : 2023-11-27

  • Articles et rapports : 75F0002M2023005
    Description : Lors de la diffusion des estimations pour l'année de référence 2021, des améliorations ont été apportées aux méthodes et aux systèmes utilisés dans le cadre de l'Enquête canadienne sur le revenu (ECR) pour produire les estimations du revenu. Cet article décrit les changements effectués et présente le résultat net approximatif de ces changements sur les estimations de revenu à l'aide des données de 2019 et de 2020. Les changements décrits dans cet article soulignent les façons dont la qualité des données a été améliorée, tout en ayant une incidence minimale sur les principales estimations et tendances de l'ECR.
    Date de diffusion : 2023-08-29

  • Stats en bref : 89-20-00062023001
    Description : Ce cours s’adresse aux employés du gouvernement du Canada qui veulent apprendre à évaluer la qualité des données pour un usage particulier. Que vous soyez un employé souhaitant apprendre les bases du sujet ou un spécialiste du domaine cherchant à perfectionner ses compétences, ce cours pourra vous être utile.
    Date de diffusion : 2023-07-17

  • Articles et rapports : 12-001-X202300100001
    Description : Les travaux récents sur l’estimation pour domaine d’enquête permettent d’estimer les moyennes de domaine de population selon des hypothèses a priori exprimées dans des termes de contraintes d’inégalité linéaires. Par exemple, on pourrait savoir que les moyennes de population sont non décroissantes conformément aux domaines ordonnés. Il a été montré que l’imposition de contraintes donne des estimateurs ayant une plus petite variance et des intervalles de confiance plus étroits. Dans le présent article, nous considérons un test formel de l’hypothèse nulle selon laquelle toutes les contraintes sont obligatoires, par opposition à une hypothèse alternative où au moins une contrainte n’est pas obligatoire. Le test de moyennes de domaine constantes comparativement à des moyennes de domaine croissantes est un cas particulier. La puissance du test est nettement meilleure que celle du test comportant la même hypothèse nulle et une hypothèse alternative sans contrainte. Le nouveau test est utilisé sur les données de la National Survey of College Graduates des États-Unis (NSCG, Enquête nationale sur les diplômés des collèges), pour montrer que les salaires sont positivement liés au niveau de scolarité du père du sujet, dans tous les domaines d’études et sur plusieurs années de cohortes.
    Date de diffusion : 2023-06-30

  • Articles et rapports : 12-001-X202300100002
    Description : Nous envisageons ici l’analyse de régression dans le contexte de l’intégration de données. Pour combiner des renseignements partiels de sources externes, nous utilisons l’idée de calage assisté par un modèle qui introduit un modèle « de travail » réduit fondé sur les covariables observées. Ce modèle de travail réduit n’est pas nécessairement spécifié correctement, mais il peut être un outil utile pour intégrer les renseignements partiels provenant de données externes. La mise en œuvre en tant que telle est fondée sur une application nouvelle de la projection d’information et de la pondération par calage du modèle. La méthode proposée est particulièrement intéressante pour combiner des renseignements de plusieurs sources présentant différentes tendances en matière de données manquantes. La méthode est appliquée à un exemple de données réelles combinant les données d’enquête de l'enquête KNHANES (enquête nationale coréenne sur la santé et la nutrition) et les mégadonnées du NHISS (service national coréen de partage de l’assurance maladie).
    Date de diffusion : 2023-06-30

  • Articles et rapports : 12-001-X202300100003
    Description : Pour accroître la précision des inférences et réduire les coûts, la combinaison de données provenant de plusieurs sources comme les enquêtes-échantillon et les données administratives suscite beaucoup d’intérêt. Une méthodologie appropriée est requise afin de produire des inférences satisfaisantes, puisque les populations cibles et les méthodes d’acquisition de données peuvent être assez différentes. Pour améliorer les inférences, nous utilisons une méthodologie qui a une structure plus générale que celles de la pratique actuelle. Nous commençons par le cas où l’analyste ne dispose que de statistiques sommaires provenant de chacune des sources. Dans la méthode principale, la combinaison incertaine, on suppose que l’analyste peut considérer une source, l’enquête r, comme étant de loin le meilleur choix pour l’inférence. Cette méthode part des données de l’enquête r et ajoute les données provenant des sources tierces, pour former des grappes qui comprennent l’enquête r. Nous considérons également les mélanges selon le processus de Dirichlet, l’une des méthodes bayésiennes non paramétriques les plus populaires. Nous utilisons des expressions analytiques et les résultats d’études numériques pour montrer les propriétés de la méthodologie.
    Date de diffusion : 2023-06-30

  • Articles et rapports : 12-001-X202300100004
    Description : L’Enquête sur la santé aux Pays-Bas (ESP), menée par Statistique Pays-Bas, est conçue pour produire des estimations directes fiables selon une fréquence annuelle. La collecte des données est fondée sur une combinaison d’interviews Web et d’interviews sur place. En raison des mesures de confinement prises pendant la pandémie de COVID-19, peu ou pas d’interviews sur place ont pu être effectuées, ce qui a entraîné des variations soudaines d’effets de mesure et de sélection sur les résultats de l’enquête. De plus, la production de données annuelles sur l’effet de la COVID-19 sur des thèmes liés à la santé ayant un délai d’un an nuit à la pertinence de l’enquête. La taille de l’échantillon de l’ESP ne permet pas d’obtenir des résultats pour des périodes de référence plus courtes. Dans les deux cas, le problème est résolu en élaborant un modèle de séries chronologiques structurel (MSCS) bivarié en vue d’estimer les résultats trimestriels pour huit indicateurs clés de la santé. Ce modèle combine deux séries d’estimations directes, une série fondée sur des réponses complètes et une série fondée sur des réponses fournies par Internet seulement et permet d’obtenir des prévisions fondées sur le modèle pour les indicateurs qui sont corrigés en raison des pertes subies par l’arrêt ou la diminution des interviews sur place pendant les périodes de confinement. Le modèle est également utilisé comme une forme d’estimation sur petits domaines et tire des renseignements des échantillons des périodes de référence précédentes. Des statistiques à jour et pertinentes décrivant les effets de la pandémie de COVID-19 sur la santé aux Pays-Bas sont ainsi publiées. Dans le présent article, la méthode fondée sur le MSCS bivarié est comparée à deux autres méthodes. La première emploie un MSCS univarié où aucune correction n’est apportée aux estimations en raison des pertes subies par l’arrêt ou la diminution des interviews sur place. La deuxième utilise un MSCS univarié doté également d’une variable d’intervention modélisant l’effet de cette perte de réponses en raison de l’arrêt ou de la diminution des interviews sur place pendant le confinement.
    Date de diffusion : 2023-06-30

  • Articles et rapports : 12-001-X202300100005
    Description : Le lissage des poids est une technique utile pour améliorer l’efficacité des estimateurs fondés sur le plan exposés au risque de biais en raison d’une spécification erronée du modèle. Dans le prolongement du travail de Kim et Skinner (2013), nous proposons d’employer le lissage des poids pour construire la vraisemblance conditionnelle pour une inférence analytique efficace dans le cadre d’un échantillonnage informatif. La distribution bêta prime peut être utilisée pour construire un modèle de paramètres pour les poids dans l’échantillon. Un test du score est développé pour tester les erreurs de spécifications dans le modèle de pondération. Un estimateur de prétest s’appuyant sur le test du score peut être élaboré naturellement. L’estimateur de prétest est presque exempt de biais et peut être plus efficace que l’estimateur fondé sur le plan lorsque le modèle de pondération est correctement spécifié ou que les poids d’origine sont très variables. Une étude par simulation limitée est présentée pour étudier le rendement des méthodes proposées.
    Date de diffusion : 2023-06-30
Stats en bref (1)

Stats en bref (1) ((1 résultat))

  • Stats en bref : 89-20-00062023001
    Description : Ce cours s’adresse aux employés du gouvernement du Canada qui veulent apprendre à évaluer la qualité des données pour un usage particulier. Que vous soyez un employé souhaitant apprendre les bases du sujet ou un spécialiste du domaine cherchant à perfectionner ses compétences, ce cours pourra vous être utile.
    Date de diffusion : 2023-07-17
Articles et rapports (21)

Articles et rapports (21) (0 à 10 de 21 résultats)

  • Articles et rapports : 82-003-X202301200002
    Description : La validité des estimations de la survie fondées sur les données des registres du cancer découle en partie du repérage des décès de personnes atteintes de cancer. Les personnes dont le décès n’est pas repéré semblent vivre éternellement et sont informellement appelées « immortelles ». Leur présence dans les données des registres peut entraîner des estimations de survie exagérées. L’étude évalue l’enjeu des immortels dans le Registre canadien du cancer au moyen d’une méthode proposée qui permet de comparer la survie des survivants à long terme du cancer pour lesquels un remède « statistique » a été déclaré avec celle d’autres personnes similaires issues de la population générale.
    Date de diffusion : 2023-12-20

  • Articles et rapports : 11-633-X2023003
    Description : Ce document couvre les travaux universitaires et les stratégies d’estimation utilisées par les organismes nationaux de statistique. Il aborde la question de la production d’estimations géographiques détaillées au niveau du quadrillage pour le Canada en étudiant la mesure du produit intérieur brut infraprovincial et infraterritorial à l’aide du Yukon comme scénario d’essai.
    Date de diffusion : 2023-12-15

  • Articles et rapports : 45-20-00022023004
    Description : L'analyse comparative entre les sexes plus (ACS Plus) est un outil analytique développé par Femmes et Égalité des genres Canada (FEGC) pour soutenir l'élaboration d'initiatives réactives et inclusives, telles que des politiques, des programmes et d'autres initiatives. Cette fiche d'information présente l'utilité de l’ACS Plus pour la désagrégation et l'analyse des données afin d'identifier les groupes les plus touchés par certains enjeux, comme la surqualification.
    Date de diffusion : 2023-11-27

  • Articles et rapports : 75F0002M2023005
    Description : Lors de la diffusion des estimations pour l'année de référence 2021, des améliorations ont été apportées aux méthodes et aux systèmes utilisés dans le cadre de l'Enquête canadienne sur le revenu (ECR) pour produire les estimations du revenu. Cet article décrit les changements effectués et présente le résultat net approximatif de ces changements sur les estimations de revenu à l'aide des données de 2019 et de 2020. Les changements décrits dans cet article soulignent les façons dont la qualité des données a été améliorée, tout en ayant une incidence minimale sur les principales estimations et tendances de l'ECR.
    Date de diffusion : 2023-08-29

  • Articles et rapports : 12-001-X202300100001
    Description : Les travaux récents sur l’estimation pour domaine d’enquête permettent d’estimer les moyennes de domaine de population selon des hypothèses a priori exprimées dans des termes de contraintes d’inégalité linéaires. Par exemple, on pourrait savoir que les moyennes de population sont non décroissantes conformément aux domaines ordonnés. Il a été montré que l’imposition de contraintes donne des estimateurs ayant une plus petite variance et des intervalles de confiance plus étroits. Dans le présent article, nous considérons un test formel de l’hypothèse nulle selon laquelle toutes les contraintes sont obligatoires, par opposition à une hypothèse alternative où au moins une contrainte n’est pas obligatoire. Le test de moyennes de domaine constantes comparativement à des moyennes de domaine croissantes est un cas particulier. La puissance du test est nettement meilleure que celle du test comportant la même hypothèse nulle et une hypothèse alternative sans contrainte. Le nouveau test est utilisé sur les données de la National Survey of College Graduates des États-Unis (NSCG, Enquête nationale sur les diplômés des collèges), pour montrer que les salaires sont positivement liés au niveau de scolarité du père du sujet, dans tous les domaines d’études et sur plusieurs années de cohortes.
    Date de diffusion : 2023-06-30

  • Articles et rapports : 12-001-X202300100002
    Description : Nous envisageons ici l’analyse de régression dans le contexte de l’intégration de données. Pour combiner des renseignements partiels de sources externes, nous utilisons l’idée de calage assisté par un modèle qui introduit un modèle « de travail » réduit fondé sur les covariables observées. Ce modèle de travail réduit n’est pas nécessairement spécifié correctement, mais il peut être un outil utile pour intégrer les renseignements partiels provenant de données externes. La mise en œuvre en tant que telle est fondée sur une application nouvelle de la projection d’information et de la pondération par calage du modèle. La méthode proposée est particulièrement intéressante pour combiner des renseignements de plusieurs sources présentant différentes tendances en matière de données manquantes. La méthode est appliquée à un exemple de données réelles combinant les données d’enquête de l'enquête KNHANES (enquête nationale coréenne sur la santé et la nutrition) et les mégadonnées du NHISS (service national coréen de partage de l’assurance maladie).
    Date de diffusion : 2023-06-30

  • Articles et rapports : 12-001-X202300100003
    Description : Pour accroître la précision des inférences et réduire les coûts, la combinaison de données provenant de plusieurs sources comme les enquêtes-échantillon et les données administratives suscite beaucoup d’intérêt. Une méthodologie appropriée est requise afin de produire des inférences satisfaisantes, puisque les populations cibles et les méthodes d’acquisition de données peuvent être assez différentes. Pour améliorer les inférences, nous utilisons une méthodologie qui a une structure plus générale que celles de la pratique actuelle. Nous commençons par le cas où l’analyste ne dispose que de statistiques sommaires provenant de chacune des sources. Dans la méthode principale, la combinaison incertaine, on suppose que l’analyste peut considérer une source, l’enquête r, comme étant de loin le meilleur choix pour l’inférence. Cette méthode part des données de l’enquête r et ajoute les données provenant des sources tierces, pour former des grappes qui comprennent l’enquête r. Nous considérons également les mélanges selon le processus de Dirichlet, l’une des méthodes bayésiennes non paramétriques les plus populaires. Nous utilisons des expressions analytiques et les résultats d’études numériques pour montrer les propriétés de la méthodologie.
    Date de diffusion : 2023-06-30

  • Articles et rapports : 12-001-X202300100004
    Description : L’Enquête sur la santé aux Pays-Bas (ESP), menée par Statistique Pays-Bas, est conçue pour produire des estimations directes fiables selon une fréquence annuelle. La collecte des données est fondée sur une combinaison d’interviews Web et d’interviews sur place. En raison des mesures de confinement prises pendant la pandémie de COVID-19, peu ou pas d’interviews sur place ont pu être effectuées, ce qui a entraîné des variations soudaines d’effets de mesure et de sélection sur les résultats de l’enquête. De plus, la production de données annuelles sur l’effet de la COVID-19 sur des thèmes liés à la santé ayant un délai d’un an nuit à la pertinence de l’enquête. La taille de l’échantillon de l’ESP ne permet pas d’obtenir des résultats pour des périodes de référence plus courtes. Dans les deux cas, le problème est résolu en élaborant un modèle de séries chronologiques structurel (MSCS) bivarié en vue d’estimer les résultats trimestriels pour huit indicateurs clés de la santé. Ce modèle combine deux séries d’estimations directes, une série fondée sur des réponses complètes et une série fondée sur des réponses fournies par Internet seulement et permet d’obtenir des prévisions fondées sur le modèle pour les indicateurs qui sont corrigés en raison des pertes subies par l’arrêt ou la diminution des interviews sur place pendant les périodes de confinement. Le modèle est également utilisé comme une forme d’estimation sur petits domaines et tire des renseignements des échantillons des périodes de référence précédentes. Des statistiques à jour et pertinentes décrivant les effets de la pandémie de COVID-19 sur la santé aux Pays-Bas sont ainsi publiées. Dans le présent article, la méthode fondée sur le MSCS bivarié est comparée à deux autres méthodes. La première emploie un MSCS univarié où aucune correction n’est apportée aux estimations en raison des pertes subies par l’arrêt ou la diminution des interviews sur place. La deuxième utilise un MSCS univarié doté également d’une variable d’intervention modélisant l’effet de cette perte de réponses en raison de l’arrêt ou de la diminution des interviews sur place pendant le confinement.
    Date de diffusion : 2023-06-30

  • Articles et rapports : 12-001-X202300100005
    Description : Le lissage des poids est une technique utile pour améliorer l’efficacité des estimateurs fondés sur le plan exposés au risque de biais en raison d’une spécification erronée du modèle. Dans le prolongement du travail de Kim et Skinner (2013), nous proposons d’employer le lissage des poids pour construire la vraisemblance conditionnelle pour une inférence analytique efficace dans le cadre d’un échantillonnage informatif. La distribution bêta prime peut être utilisée pour construire un modèle de paramètres pour les poids dans l’échantillon. Un test du score est développé pour tester les erreurs de spécifications dans le modèle de pondération. Un estimateur de prétest s’appuyant sur le test du score peut être élaboré naturellement. L’estimateur de prétest est presque exempt de biais et peut être plus efficace que l’estimateur fondé sur le plan lorsque le modèle de pondération est correctement spécifié ou que les poids d’origine sont très variables. Une étude par simulation limitée est présentée pour étudier le rendement des méthodes proposées.
    Date de diffusion : 2023-06-30

  • Articles et rapports : 12-001-X202300100006
    Description : Mes commentaires sont répartis en trois volets : 1) bref compte rendu de mon association professionnelle avec Chris Skinner, 2) observations sur les réalisations de Skinner en matière de contrôle de la divulgation statistique et 3) propos sur la production d’inférences à partir de données d’enquête masquées.
    Date de diffusion : 2023-06-30
Revues et périodiques (0)

Revues et périodiques (0) (0 résultat)

Aucun contenu disponible actuellement

Date de modification :