Aide à l'ordre
entrées

Résultats

Tout (25)

Tout (25) (0 à 10 de 25 résultats)

  • Articles et rapports : 12-001-X202000200001
    Description :

    Le présent article construit un échantillon d’ensembles ordonnés avec probabilité proportionnelle à la taille (PPT) à partir d’une population stratifiée. Un échantillon d’ensembles ordonnés PPT partitionne les unités d’un échantillon PPT en groupes d’observations semblables. La construction de groupes semblables repose sur des positions relatives (rangs) d’unités dans de petits ensembles de comparaison. Ainsi, les rangs induisent plus de structure (stratification) dans l’échantillon en plus de la structure de données créée par des probabilités de sélection inégales dans un échantillon PPT. La structure de données ajoutée rend l’échantillon d’ensembles ordonnés PPT plus informatif qu’un échantillon PPT. On construit l’échantillon d’ensembles ordonnés PPT stratifié en sélectionnant un échantillon d’ensembles ordonnés PPT à partir de chaque strate de la population. L’article construit des estimateurs sans biais pour la moyenne de la population, le total de la population et leurs variances. On applique le nouveau plan d’échantillonnage à des données sur la production de pommes pour estimer la production totale de pommes en Turquie.

    Date de diffusion : 2020-12-15

  • Articles et rapports : 12-001-X202000200002
    Description :

    Dans de nombreuses enquêtes à grande échelle, des estimations sont produites pour un grand nombre de petits domaines définis par des classifications croisées de variables démographiques, géographiques et autres. Bien que la taille globale de l’échantillon de ces enquêtes puisse être très grande, la taille des échantillons des domaines est parfois trop petite pour permettre une estimation fiable. Nous proposons une méthode d’estimation améliorée qui s’applique quand il est possible de formuler des relations « naturelles » ou qualitatives (comme des ordonnancements ou des contraintes d’inégalité) pour les moyennes des domaines au niveau de la population. Nous restons dans un cadre inférentiel fondé sur le plan, mais nous imposons des contraintes représentant ces relations sur les estimations échantillonnales. Nous démontrons que l’estimateur de domaine contraint qui en résulte est convergent par rapport au plan et a une distribution asymptotique normale tant que les contraintes sont asymptotiquement satisfaites au niveau de la population. L’estimateur et l’estimateur de la variance connexe sont facilement mis en œuvre en pratique. L’applicabilité de la méthode est illustrée par les données de la National Survey of College Graduates des États-Unis (NSCG, Enquête nationale sur les diplômés des collèges) de 2015.

    Date de diffusion : 2020-12-15

  • Articles et rapports : 12-001-X202000200003
    Description :

    Nous combinons pondération et prédiction bayésienne dans une approche unifiée pour l’inférence d’enquête. Les principes généraux de l’analyse bayésienne impliquent que les modèles pour les résultats d’enquête devraient être conditionnés par toutes les variables influant sur les probabilités d’inclusion. Nous intégrons toutes les variables servant à l’ajustement de pondération dans un cadre de régression multiniveau et de poststratification pour obtenir un sous-produit générant des poids basés sur un modèle après lissage. Nous améliorons l’estimation sur petits domaines en traitant les divers problèmes complexes que posent les applications dans la vie réelle pour obtenir une inférence robuste à des niveaux plus fins pour les sous-domaines d’intérêt. Nous examinons les interactions profondes et introduisons des distributions a priori structurées pour le lissage et la stabilisation des estimations. Le calcul se fait par Stan et avec le paquet rstanarm du code source libre R, disponible pour utilisation publique. Nous évaluons les propriétés selon le plan de la procédure bayésienne. Nous recourons à des études en simulation pour illustrer comment la prédiction basée sur un modèle et l’inférence pondérée peuvent donner de meilleurs résultats que la pondération classique. Nous appliquons la méthode à la New York Longitudinal Study of Wellbeing (LSW). La nouvelle approche produit des poids lissés et rend plus efficace une inférence robuste de population finie, plus particulièrement pour des sous-ensembles de la population.

    Date de diffusion : 2020-12-15

  • Articles et rapports : 12-001-X202000200004
    Description :

    Le présent article propose une méthode de mise à l’échelle des poids pour la vraisemblance pénalisée de Firth pour des modèles de régression à risques proportionnels. La méthode calcule une relation entre la vraisemblance pénalisée utilisant des poids mis à l’échelle et la vraisemblance pénalisée utilisant des poids non mis à l’échelle, et elle montre que la vraisemblance pénalisée utilisant des poids mis à l’échelle possède certaines propriétés souhaitables. Une étude par simulations indique que la vraisemblance pénalisée utilisant des poids mis à l’échelle produit des biais plus petits dans les estimations ponctuelles et les erreurs-types que les biais produits par la vraisemblance pénalisée utilisant des poids non mis à l’échelle. La vraisemblance pénalisée pondérée est appliquée à l’estimation des taux de risque pour les crises cardiaques au moyen d’un ensemble de données à grande diffusion provenant de la National Health and Epidemiology Follow up Study (NHEFS, Étude de suivi épidémiologique et de santé nationale). L’annexe contient les instructions SASMD servant à estimer les taux de risque à l’aide de données d’enquêtes complexes.

    Date de diffusion : 2020-12-15

  • Articles et rapports : 12-001-X202000200005
    Description :

    Dans les enquêtes, les réponses textuelles à des questions ouvertes ont de l’importance, puisqu’elles permettent aux répondants de livrer plus de renseignements sans contrainte. Dans une classification automatique des réponses à des questions ouvertes en apprentissage supervisé, la précision souvent n’est pas assez grande. Comme autre possibilité, une stratégie de classification semi-automatisée peut être envisagée : les réponses sont classifiées automatiquement dans le groupe facile à classer et classifiées manuellement dans le reste. Nous présentons ici une méthode de classification semi-automatisée des réponses à des questions ouvertes à étiquettes multiples pour les cas où les réponses textuelles peuvent appartenir simultanément à plusieurs classes. La méthode que nous proposons se trouve à combiner de multiples chaînes de classification probabiliste en évitant des coûts de calcul prohibitifs. L’évaluation du rendement sur trois ensembles de données démontre l’efficacité de cette méthode.

    Date de diffusion : 2020-12-15

  • Articles et rapports : 11-633-X2020004
    Description :

    Les progrès accomplis récemment dans le domaine de l’intelligence artificielle ont ravivé d’anciennes craintes de voir les robots remplacer les humains dans l’économie. Les vagues d’automatisation précédentes ont modifié le rôle de la main-d’œuvre, sans toutefois le réduire, mais la flexibilité humanoïde des robots pourrait changer la donne cette fois-ci. La question de savoir si ce sera le cas est une question empirique, à laquelle on n’a pu répondre dans le passé en raison d’un manque de données pertinentes. Le présent article brosse un portrait de la création d’un ensemble de données en vue de combler cette lacune statistique au Canada. Robots! est une base de données de panel à l’échelle des entreprises sur l’adoption de robots créée à l’aide des données sur les importations canadiennes. Les données révèlent des investissements considérables dans les robots dans l’économie canadienne de 1996 à 2017. Bien que de nombreux robots soient importés par des grossistes en robotique ou des programmeurs en vue de la revente, on peut attribuer la majorité d’entre eux à l’entreprise qui finit par les adopter (directement). Les données peuvent être utilisées pour étudier l’incidence de l’adoption de robots à l’échelle des régions économiques, des industries ou des entreprises.

    Date de diffusion : 2020-11-02

  • Articles et rapports : 89-648-X2020004
    Description :

    Le présent rapport technique a pour but de valider le module de la sécurité alimentaire de l'Étude longitudinale et internationale des adultes (ELIA) de 2018 (vague 4) et de fournir des recommandations qui seront utilisées aux fins d’analyse. La section 2 du rapport donne un aperçu des données de l’ELIA. La section 3 donne des renseignements de base quant aux mesures de la sécurité alimentaire dans les enquêtes nationales et explique pourquoi ces mesures sont importantes dans la documentation actuelle. La section 4 offre une analyse des données relatives à la sécurité alimentaire en présentant des statistiques descriptives clés et des contrôles logiques faisant appel à la méthodologie de l'ELIA et à des renseignements fournis par des chercheurs externes. Dans la section 5, la validation de certification a été effectuée en comparant d'autres enquêtes nationales canadiennes qui ont utilisé un module de la sécurité alimentaire avec le module utilisé dans l’ELIA. Enfin, la section 6 présente les observations clés et leur incidence quant à l’ELIA.

    Date de diffusion : 2020-11-02

  • Articles et rapports : 62F0014M2020016
    Description :

    Un résumé des traitements méthodologiques appliqués à l'IPC d'août 2020 en réponse aux effets de la pandémie de la COVID-19 sur la collecte des prix, la disponibilité des prix et les fermetures d'entreprises.

    Date de diffusion : 2020-09-16

  • Articles et rapports : 82-003-X202000800002
    Description :

    La présente étude avait pour but d'examiner les propriétés psychométriques du questionnaire sur les points forts et les difficultés évalués par les parents au moyen d'un échantillon d'enfants et d'adolescents canadiens représentatif à l'échelle nationale.

    Date de diffusion : 2020-08-19

  • Articles et rapports : 11-633-X2020002
    Description :

    Les concepts de région urbaine et de région rurale font l’objet de nombreux débats et varient selon la composition géopolitique et sociodémographique de chaque pays. Au Canada, les classifications des centres de population et des secteurs statistiques sont largement utilisées pour distinguer les collectivités urbaines des collectivités rurales. Toutefois, aucune de ces classifications ne ventile précisément les collectivités canadiennes en régions urbaines, rurales et éloignées. Pour combler cette lacune, un groupe de chercheurs de Statistique Canada a mis au point un outil appelé l’« indice d’éloignement » pour mesurer l’éloignement relatif des collectivités canadiennes. La présente étude met à profit cet indice d’éloignement, qui est un indice continu, pour aborder la façon dont les collectivités canadiennes peuvent être classées en cinq catégories distinctes de régions géographiques éloignées. Lorsqu’il est utilisé adéquatement, l’indice d’éloignement peut aider à distinguer les collectivités urbaines, rurales et éloignées du Canada, tout en protégeant la vie privée et la confidentialité des citoyens. Les auteurs de la présente étude y examinent cinq approches méthodologiques et en recommandent trois

    Date de diffusion : 2020-08-11
Stats en bref (0)

Stats en bref (0) (0 résultat)

Aucun contenu disponible actuellement

Articles et rapports (25)

Articles et rapports (25) (0 à 10 de 25 résultats)

  • Articles et rapports : 12-001-X202000200001
    Description :

    Le présent article construit un échantillon d’ensembles ordonnés avec probabilité proportionnelle à la taille (PPT) à partir d’une population stratifiée. Un échantillon d’ensembles ordonnés PPT partitionne les unités d’un échantillon PPT en groupes d’observations semblables. La construction de groupes semblables repose sur des positions relatives (rangs) d’unités dans de petits ensembles de comparaison. Ainsi, les rangs induisent plus de structure (stratification) dans l’échantillon en plus de la structure de données créée par des probabilités de sélection inégales dans un échantillon PPT. La structure de données ajoutée rend l’échantillon d’ensembles ordonnés PPT plus informatif qu’un échantillon PPT. On construit l’échantillon d’ensembles ordonnés PPT stratifié en sélectionnant un échantillon d’ensembles ordonnés PPT à partir de chaque strate de la population. L’article construit des estimateurs sans biais pour la moyenne de la population, le total de la population et leurs variances. On applique le nouveau plan d’échantillonnage à des données sur la production de pommes pour estimer la production totale de pommes en Turquie.

    Date de diffusion : 2020-12-15

  • Articles et rapports : 12-001-X202000200002
    Description :

    Dans de nombreuses enquêtes à grande échelle, des estimations sont produites pour un grand nombre de petits domaines définis par des classifications croisées de variables démographiques, géographiques et autres. Bien que la taille globale de l’échantillon de ces enquêtes puisse être très grande, la taille des échantillons des domaines est parfois trop petite pour permettre une estimation fiable. Nous proposons une méthode d’estimation améliorée qui s’applique quand il est possible de formuler des relations « naturelles » ou qualitatives (comme des ordonnancements ou des contraintes d’inégalité) pour les moyennes des domaines au niveau de la population. Nous restons dans un cadre inférentiel fondé sur le plan, mais nous imposons des contraintes représentant ces relations sur les estimations échantillonnales. Nous démontrons que l’estimateur de domaine contraint qui en résulte est convergent par rapport au plan et a une distribution asymptotique normale tant que les contraintes sont asymptotiquement satisfaites au niveau de la population. L’estimateur et l’estimateur de la variance connexe sont facilement mis en œuvre en pratique. L’applicabilité de la méthode est illustrée par les données de la National Survey of College Graduates des États-Unis (NSCG, Enquête nationale sur les diplômés des collèges) de 2015.

    Date de diffusion : 2020-12-15

  • Articles et rapports : 12-001-X202000200003
    Description :

    Nous combinons pondération et prédiction bayésienne dans une approche unifiée pour l’inférence d’enquête. Les principes généraux de l’analyse bayésienne impliquent que les modèles pour les résultats d’enquête devraient être conditionnés par toutes les variables influant sur les probabilités d’inclusion. Nous intégrons toutes les variables servant à l’ajustement de pondération dans un cadre de régression multiniveau et de poststratification pour obtenir un sous-produit générant des poids basés sur un modèle après lissage. Nous améliorons l’estimation sur petits domaines en traitant les divers problèmes complexes que posent les applications dans la vie réelle pour obtenir une inférence robuste à des niveaux plus fins pour les sous-domaines d’intérêt. Nous examinons les interactions profondes et introduisons des distributions a priori structurées pour le lissage et la stabilisation des estimations. Le calcul se fait par Stan et avec le paquet rstanarm du code source libre R, disponible pour utilisation publique. Nous évaluons les propriétés selon le plan de la procédure bayésienne. Nous recourons à des études en simulation pour illustrer comment la prédiction basée sur un modèle et l’inférence pondérée peuvent donner de meilleurs résultats que la pondération classique. Nous appliquons la méthode à la New York Longitudinal Study of Wellbeing (LSW). La nouvelle approche produit des poids lissés et rend plus efficace une inférence robuste de population finie, plus particulièrement pour des sous-ensembles de la population.

    Date de diffusion : 2020-12-15

  • Articles et rapports : 12-001-X202000200004
    Description :

    Le présent article propose une méthode de mise à l’échelle des poids pour la vraisemblance pénalisée de Firth pour des modèles de régression à risques proportionnels. La méthode calcule une relation entre la vraisemblance pénalisée utilisant des poids mis à l’échelle et la vraisemblance pénalisée utilisant des poids non mis à l’échelle, et elle montre que la vraisemblance pénalisée utilisant des poids mis à l’échelle possède certaines propriétés souhaitables. Une étude par simulations indique que la vraisemblance pénalisée utilisant des poids mis à l’échelle produit des biais plus petits dans les estimations ponctuelles et les erreurs-types que les biais produits par la vraisemblance pénalisée utilisant des poids non mis à l’échelle. La vraisemblance pénalisée pondérée est appliquée à l’estimation des taux de risque pour les crises cardiaques au moyen d’un ensemble de données à grande diffusion provenant de la National Health and Epidemiology Follow up Study (NHEFS, Étude de suivi épidémiologique et de santé nationale). L’annexe contient les instructions SASMD servant à estimer les taux de risque à l’aide de données d’enquêtes complexes.

    Date de diffusion : 2020-12-15

  • Articles et rapports : 12-001-X202000200005
    Description :

    Dans les enquêtes, les réponses textuelles à des questions ouvertes ont de l’importance, puisqu’elles permettent aux répondants de livrer plus de renseignements sans contrainte. Dans une classification automatique des réponses à des questions ouvertes en apprentissage supervisé, la précision souvent n’est pas assez grande. Comme autre possibilité, une stratégie de classification semi-automatisée peut être envisagée : les réponses sont classifiées automatiquement dans le groupe facile à classer et classifiées manuellement dans le reste. Nous présentons ici une méthode de classification semi-automatisée des réponses à des questions ouvertes à étiquettes multiples pour les cas où les réponses textuelles peuvent appartenir simultanément à plusieurs classes. La méthode que nous proposons se trouve à combiner de multiples chaînes de classification probabiliste en évitant des coûts de calcul prohibitifs. L’évaluation du rendement sur trois ensembles de données démontre l’efficacité de cette méthode.

    Date de diffusion : 2020-12-15

  • Articles et rapports : 11-633-X2020004
    Description :

    Les progrès accomplis récemment dans le domaine de l’intelligence artificielle ont ravivé d’anciennes craintes de voir les robots remplacer les humains dans l’économie. Les vagues d’automatisation précédentes ont modifié le rôle de la main-d’œuvre, sans toutefois le réduire, mais la flexibilité humanoïde des robots pourrait changer la donne cette fois-ci. La question de savoir si ce sera le cas est une question empirique, à laquelle on n’a pu répondre dans le passé en raison d’un manque de données pertinentes. Le présent article brosse un portrait de la création d’un ensemble de données en vue de combler cette lacune statistique au Canada. Robots! est une base de données de panel à l’échelle des entreprises sur l’adoption de robots créée à l’aide des données sur les importations canadiennes. Les données révèlent des investissements considérables dans les robots dans l’économie canadienne de 1996 à 2017. Bien que de nombreux robots soient importés par des grossistes en robotique ou des programmeurs en vue de la revente, on peut attribuer la majorité d’entre eux à l’entreprise qui finit par les adopter (directement). Les données peuvent être utilisées pour étudier l’incidence de l’adoption de robots à l’échelle des régions économiques, des industries ou des entreprises.

    Date de diffusion : 2020-11-02

  • Articles et rapports : 89-648-X2020004
    Description :

    Le présent rapport technique a pour but de valider le module de la sécurité alimentaire de l'Étude longitudinale et internationale des adultes (ELIA) de 2018 (vague 4) et de fournir des recommandations qui seront utilisées aux fins d’analyse. La section 2 du rapport donne un aperçu des données de l’ELIA. La section 3 donne des renseignements de base quant aux mesures de la sécurité alimentaire dans les enquêtes nationales et explique pourquoi ces mesures sont importantes dans la documentation actuelle. La section 4 offre une analyse des données relatives à la sécurité alimentaire en présentant des statistiques descriptives clés et des contrôles logiques faisant appel à la méthodologie de l'ELIA et à des renseignements fournis par des chercheurs externes. Dans la section 5, la validation de certification a été effectuée en comparant d'autres enquêtes nationales canadiennes qui ont utilisé un module de la sécurité alimentaire avec le module utilisé dans l’ELIA. Enfin, la section 6 présente les observations clés et leur incidence quant à l’ELIA.

    Date de diffusion : 2020-11-02

  • Articles et rapports : 62F0014M2020016
    Description :

    Un résumé des traitements méthodologiques appliqués à l'IPC d'août 2020 en réponse aux effets de la pandémie de la COVID-19 sur la collecte des prix, la disponibilité des prix et les fermetures d'entreprises.

    Date de diffusion : 2020-09-16

  • Articles et rapports : 82-003-X202000800002
    Description :

    La présente étude avait pour but d'examiner les propriétés psychométriques du questionnaire sur les points forts et les difficultés évalués par les parents au moyen d'un échantillon d'enfants et d'adolescents canadiens représentatif à l'échelle nationale.

    Date de diffusion : 2020-08-19

  • Articles et rapports : 11-633-X2020002
    Description :

    Les concepts de région urbaine et de région rurale font l’objet de nombreux débats et varient selon la composition géopolitique et sociodémographique de chaque pays. Au Canada, les classifications des centres de population et des secteurs statistiques sont largement utilisées pour distinguer les collectivités urbaines des collectivités rurales. Toutefois, aucune de ces classifications ne ventile précisément les collectivités canadiennes en régions urbaines, rurales et éloignées. Pour combler cette lacune, un groupe de chercheurs de Statistique Canada a mis au point un outil appelé l’« indice d’éloignement » pour mesurer l’éloignement relatif des collectivités canadiennes. La présente étude met à profit cet indice d’éloignement, qui est un indice continu, pour aborder la façon dont les collectivités canadiennes peuvent être classées en cinq catégories distinctes de régions géographiques éloignées. Lorsqu’il est utilisé adéquatement, l’indice d’éloignement peut aider à distinguer les collectivités urbaines, rurales et éloignées du Canada, tout en protégeant la vie privée et la confidentialité des citoyens. Les auteurs de la présente étude y examinent cinq approches méthodologiques et en recommandent trois

    Date de diffusion : 2020-08-11
Revues et périodiques (0)

Revues et périodiques (0) (0 résultat)

Aucun contenu disponible actuellement

Date de modification :