Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Année de publication

1 facets displayed. 1 facets selected.

Enquête ou programme statistique

24 facets displayed. 0 facets selected.

Contenu

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (35)

Tout (35) (0 à 10 de 35 résultats)

  • Stats en bref : 45-28-0001202100100041
    Description :

    Le présent article utilise les données de la première série de l’Enquête sociale canadienne – COVID-19 et bien-être (ESC-CB) pour déterminer si les personnes âgées de 15 à 49 ans ont apporté des changements à leurs projets en matière de fécondité en raison de la pandémie de COVID-19. Les changements quant aux intentions d'avoir des enfants sont explorés, y compris ceux liés au moment d'en avoir et ceux qui ont une incidence sur le nombre d’enfants souhaités. Enfin, nous examinons dans quelle mesure les personnes ayant certaines caractéristiques sociodémographiques étaient plus ou moins susceptibles d’ajuster leurs projets en matière de fécondité en réponse à la pandémie.

    Date de diffusion : 2021-12-01

  • Articles et rapports : 36-28-0001202101100002
    Description :

    Les étudiants du niveau postsecondaire peuvent demander des crédits pour études postsecondaires afin de réduire leurs obligations fiscales (ou celles d’un parent, d’un des grands-parents, d’un conjoint ou d’un partenaire en union libre, ou de leurs parents ou grands-parents). Il ne coûte rien de demander ces crédits, mais il faut connaître leur fonctionnement pour réduire ses impôts. Par conséquent, les taux de demandes peuvent être inégaux selon les contextes socioéconomiques, notamment le niveau de revenu parental (un levier stratégique clé pour l’aide financière aux étudiants fondée sur les besoins). Le présent article vise à documenter les taux de demandes chez les étudiants du niveau postsecondaire selon le niveau de revenu parental, ainsi qu’à réévaluer les tendances des taux d’inscription aux études postsecondaires selon le niveau de revenu parental compte tenu des taux de demandes inégaux. Ces tendances ont déjà été établies à l’aide de renseignements sur les crédits d’impôt dans les données fiscales. La présente étude utilise les données du Fichier des familles T1 (FFT1) et du Système d’information sur les étudiants postsecondaires (SIEP), qui ont récemment été couplés pour les dix provinces à partir de 2009.

    Date de diffusion : 2021-11-24

  • Articles et rapports : 36-28-0001202101100004
    Description :

    Bien que les femmes soient plus nombreuses que les hommes dans les établissements d’enseignement postsecondaire, elles sont considérablement moins susceptibles de choisir les domaines en science, technologie, génie et mathématiques (STGM) les mieux rémunérés, ce qui pourrait être un facteur dans l’écart salarial entre les hommes et les femmes. Bien que de nombreuses études aient examiné la sous-représentation persistante des femmes dans les programmes en STGM parmi les diplômés postsecondaires, l’objectif de la présente étude consiste à faire progresser les données probantes canadiennes de trois façons. Premièrement, l’étude fait la distinction entre deux types de différences selon le genre dans la probabilité de sélectionner des domaines liés aux STGM dans un programme de baccalauréat, soit ceux qui sont conditionnels à l’inscription à un programme de baccalauréat et ceux qui ne le sont pas. Deuxièmement, l’étude souligne les différences selon le genre dans certains programmes en STGM. Troisièmement, l’étude porte sur l’érosion importante de l’échantillon des enquêtes-ménages longitudinales qui ont été utilisées pour étudier la question dans plusieurs études antérieures. À cette fin, l’étude utilise un ensemble de données administratives qui fournissent des renseignements détaillés sur le rendement scolaire des élèves de la maternelle à la 12e année dans la troisième province la plus peuplée du Canada, la Colombie-Britannique.

    Date de diffusion : 2021-11-24

  • Articles et rapports : 89-657-X2021006
    Description :

    Ce feuillet présente l'évolution de 2001 à 2016 du nombre et de la proportion de jeunes enfants susceptibles de fréquenter un service de garde de langue française ainsi que du nombre et de la proportion de travailleurs des services de garde utilisant le français au travail au Canada hors Québec. Les données utilisées proviennent des recensements de la population de 2001 et 2016.

    Date de diffusion : 2021-11-18

  • Articles et rapports : 89-657-X2021007
    Description :

    Ce feuillet présente l'évolution de 2001 à 2016 du nombre et de la proportion de jeunes enfants susceptibles de fréquenter un service de garde de langue anglaise ainsi que du nombre et de la proportion de travailleurs des services de garde utilisant l'anglais au travail au Québec. Les données utilisées proviennent des recensements de la population de 2001 et 2016.

    Date de diffusion : 2021-11-18

  • Articles et rapports : 11-633-X2021007
    Description :

    Statistique Canada continue d’utiliser diverses sources de données pour fournir des variables au niveau des quartiers dans un ensemble croissant de domaines, comme les caractéristiques sociodémographiques, le revenu, les services et les commodités, la criminalité et l’environnement. Pourtant, malgré ces progrès, les renseignements sur les aspects sociaux des quartiers ne sont toujours pas disponibles. Dans le présent article, les réponses à l’Enquête sur la santé dans les collectivités canadiennes concernant le sentiment d’appartenance des répondants à leur communauté locale ont été regroupées pour les quatre années d’enquête allant de 2016 à 2019. Les réponses individuelles ont été agrégées au niveau du secteur de recensement (SR).

    Date de diffusion : 2021-11-16

  • Articles et rapports : 11-522-X202100100018
    Description : Le Centre des statistiques finlandais a commencé à publier des prévisions immédiates de l’indicateur de tendance de la production ou TIO (pour Trend Indicator of Output), l’indicateur mensuel de l’activité économique réelle, afin de répondre aux besoins des utilisateurs pendant la pandémie de COVID-19. Cet indicateur a été d’abord publié en avril 2020, au tout début de la pandémie en Finlande, et a depuis été publié chaque mois jusqu’en juin 2021. Les prévisions immédiates de l’indicateur TIO sont élaborées à l’aide de données de sources ouverte relatives aux volumes de circulation de camions à environ 100 points de mesure automatiques dans la région de Helsinki/Uusimaa ainsi qu’à l’aide de l’indicateur du climat économique pour la Finlande. L’estimation est effectuée à l’aide d’une approche d’apprentissage automatique et la méthodologie se fonde sur le travail réalisé antérieurement par le Centre des statistiques finlandais et ETLA Economic Research.

    Mots clés : prévisions immédiates; estimations rapides; apprentissage automatique; statistiques expérimentales.

    Date de diffusion : 2021-10-29

  • Articles et rapports : 11-522-X202100100025
    Description :

    Nous proposons une analyse longitudinale selon un point de vue lié aux changements organisationnels intervenus à l’Institut national italien de statistique ces dernières années. En 2016, l’Institut a mis en place une nouvelle direction, en vue d’uniformiser et de généraliser le processus opérationnel de la collecte de données conformément à la norme européenne du modèle GAMSO. Dans cette étude, nous discutons des avantages et des inconvénients de ce changement du point de vue de la participation aux enquêtes. L’analyse du taux de réponse aux enquêtes sur les TIC révèle une hausse d’environ 20 % depuis le début de la nouvelle organisation : le présent article tente de se concentrer sur les répercussions des changements apportés avec la nouvelle organisation. Nous nous sommes concentrés sur deux sous-ensembles donnés de répondants : celui appelé des « personnes recherchées », à savoir celles n’ayant jamais répondu à une enquête sur les TIC ni à toute autre enquête de l’ISTAT, d’une part, et le sous-ensemble des personnes dites « perdues », qui étaient incluses dans les échantillons de deux enquêtes consécutives et qui ont répondu à l’édition précédente, mais pas à l’édition actuelle. Cette étude vise à illustrer la façon dont l’organisation efficace de la collecte de données améliore les résultats de l’enquête ainsi que le type de mesures qui devraient être prises pour attirer l’attention des « personnes recherchées ». Enfin, nous appliquons un modèle logistique qui mesure la probabilité qu’une entreprise ayant répondu en 2018 (t-1) réponde également en 2019 (t). De plus, l’analyse suggère des mesures qui pourraient être prises pour améliorer la participation des répondants, la qualité des données ainsi que la perception qu’ont les répondants des statistiques officielles.

    Mots clés : stratégie de collecte des données; taux de réponse; paradonnées; fardeau de réponse; enquête sur les TIC.

    Date de diffusion : 2021-10-29

  • Articles et rapports : 11-522-X202100100005
    Description : Le Recensement de la population et des logements permanent est la nouvelle stratégie de recensement adoptée en Italie en 2018; il est fondé sur des registres statistiques combinés à des données recueillies au moyen d’enquêtes spécifiquement conçues pour améliorer la qualité des registres et garantir les produits du recensement. Le registre au cœur du recensement permanent est le registre de base de la population (RBP ou RBI en italien, pour Registro Base degli Individui), dont les principales sources administratives sont les registres locaux de la population. Les chiffres de la population sont déterminés par correction des données du RBI au moyen de coefficients basés sur les erreurs de couverture estimées à l’aide des données d’enquête, mais le besoin de sources administratives supplémentaires est clairement ressorti pendant le traitement des données recueillies pendant le premier cycle du recensement permanent. La suspension des enquêtes en raison de l’urgence de la pandémie, combinée à une réduction importante du budget du recensement pour les prochaines années, rend plus impératif encore de modifier le processus d’estimation afin d’utiliser les données administratives comme source principale. Un registre thématique a été mis en place afin d’exploiter toutes les sources administratives supplémentaires; la découverte de connaissances à partir de cette base de données est essentielle pour mettre en évidence les tendances pertinentes et créer de nouvelles dimensions, appelées « signes de vie », utiles pour l’estimation de la population. La disponibilité des données recueillies lors des deux premières vagues du recensement offre un ensemble unique et précieux aux fins d’apprentissage statistique; l’association entre les résultats d’enquête et les « signes de vie » pourrait servir à créer un modèle de classification permettant de prédire des erreurs de couverture dans le registre de base de la population (RBI). Le présent article présente les résultats du processus visant à produire des « signes de vie » qui se sont révélés importants dans l’estimation de la population.

    Mots clés : données administratives; recensement de la population; registres statistiques; découverte de connaissances à partir de bases de données.

    Date de diffusion : 2021-10-22

  • Articles et rapports : 11-522-X202100100014
    Description : De récents développements des modes d’administration de questionnaires et d’extraction de données ont favorisé l’utilisation d’échantillons non probabilistes, qui présentent souvent un biais de sélection découlant d’un manque de plan de sondage ou de l’autosélection des participants. Ce biais peut être traité par plusieurs ajustements, dont l’applicabilité dépend du type d’information auxiliaire disponible. Des poids de calage peuvent être utilisés lorsque seuls des totaux de population de variables auxiliaires sont disponibles. En cas de disponibilité d’une enquête de référence respectant un plan de sondage probabiliste, plusieurs méthodes peuvent être appliquées, comme l’ajustement sur le score de propension, l’appariement statistique ou l’imputation de masse, ainsi que des estimateurs doublement robustes. En cas de disponibilité d’un recensement complet de la population cible pour certaines covariables auxiliaires, des estimateurs fondés sur des modèles de superpopulation (souvent utilisés en échantillonnage probabiliste) peuvent être adaptés au cas d’échantillonnage non probabiliste. Nous avons étudié la combinaison de certaines de ces méthodes, afin de produire des estimations moins biaisées et plus efficaces, ainsi que l’utilisation de techniques de prédiction modernes (comme la classification par apprentissage automatique et des algorithmes de régression) dans les étapes de modélisation des ajustements décrits. Nous avons en outre étudié l’utilisation de techniques de sélection de variables avant l’étape de modélisation de l’ajustement sur le score de propension. Les résultats indiquent que les ajustements fondés sur la combinaison de plusieurs méthodes peuvent améliorer l’efficacité des estimations et que l’utilisation de l’apprentissage automatique et de techniques de sélection de variables peut contribuer à réduire le biais et la variance des estimateurs dans une plus grande mesure dans plusieurs situations.

    Mots clés : échantillonnage non probabiliste; calage; ajustement sur le score de propension; appariement.

    Date de diffusion : 2021-10-15
Stats en bref (6)

Stats en bref (6) ((6 résultats))

  • Stats en bref : 45-28-0001202100100041
    Description :

    Le présent article utilise les données de la première série de l’Enquête sociale canadienne – COVID-19 et bien-être (ESC-CB) pour déterminer si les personnes âgées de 15 à 49 ans ont apporté des changements à leurs projets en matière de fécondité en raison de la pandémie de COVID-19. Les changements quant aux intentions d'avoir des enfants sont explorés, y compris ceux liés au moment d'en avoir et ceux qui ont une incidence sur le nombre d’enfants souhaités. Enfin, nous examinons dans quelle mesure les personnes ayant certaines caractéristiques sociodémographiques étaient plus ou moins susceptibles d’ajuster leurs projets en matière de fécondité en réponse à la pandémie.

    Date de diffusion : 2021-12-01

  • Stats en bref : 45-28-0001202100100020
    Description :

    La pandémie de COVID-19 a accéléré le besoin de données plus actuelles sur les industries de services, car certains des secteurs les plus touchés et parmi les derniers à se rétablir seront de ce côté de l'économie. Le document examine les estimations provisoires des revenus d'exploitation en 2020 pour les principales industries de services professionnels aux entreprises et de soutien administratif au Canada qui ont traditionnellement résisté aux récessions.

    Date de diffusion : 2021-05-21

  • Stats en bref : 45-28-0001202100100015
    Description :

    Cet article examine certains des effets de la COVID-19 sur les entreprises rurales au Canada, en comparaison avec les homologues urbains au niveau provincial et territorial pour le soutien contextuel. Les sujets abordés comprennent les changements de revenus, obstacles et défis pour les entreprises, l'état de fonctionnement des entreprises, et d'autres sujets tirés de l'Enquête canadienne sur la situation des entreprises, premier trimestre de 2021.

    Date de diffusion : 2021-05-04

  • Stats en bref : 11-627-M2021010
    Description :

    La « Stratégie de réduction de la pauvreté du Canada » établit le Seuil officiel de la pauvreté au Canada ainsi qu'un tableau de bord de 12 indicateurs pour suivre le progrès de la réduction de la pauvreté chez les Canadiens et leurs ménages. Cette infographie présente des informations sur les tendances du taux officel de pauvreté au Canada et les12 indicateurs associés.

    Date de diffusion : 2021-03-23

  • Stats en bref : 45-28-0001202100100002
    Description :

    Cet article examine si les attentes des parents à l’égard de leurs enfants en ce qui a trait aux études supérieures et leurs plans pour aider leurs enfants à assumer les aspects financiers des études postsecondaires, au moyen de l’épargne et d’autres façons, ont changé depuis le début de la pandémie de COVID-19. L’analyse est fondée sur l’Enquête sur les approches en matière de planification des études (EAPE), menée entre le 2 février et le 20 juin 2020.

    Date de diffusion : 2021-01-27

  • Stats en bref : 45-28-0001202100100001
    Description :

    Le présent article porte sur les changements dans le nombre d'entreprises qui ont déposé un dossier en vertu de la Loi sur la faillite et l'insolvabilité et de la Loi sur les arrangements avec les créanciers des compagnies de 2006 au troisième trimestre de 2020. L'analyse met en évidence le nombre d'entreprises qui demandent la protection contre les créanciers, ainsi que la situation financière de ces entreprises avant le début de la pandémie.

    Date de diffusion : 2021-01-18
Articles et rapports (29)

Articles et rapports (29) (0 à 10 de 29 résultats)

  • Articles et rapports : 36-28-0001202101100002
    Description :

    Les étudiants du niveau postsecondaire peuvent demander des crédits pour études postsecondaires afin de réduire leurs obligations fiscales (ou celles d’un parent, d’un des grands-parents, d’un conjoint ou d’un partenaire en union libre, ou de leurs parents ou grands-parents). Il ne coûte rien de demander ces crédits, mais il faut connaître leur fonctionnement pour réduire ses impôts. Par conséquent, les taux de demandes peuvent être inégaux selon les contextes socioéconomiques, notamment le niveau de revenu parental (un levier stratégique clé pour l’aide financière aux étudiants fondée sur les besoins). Le présent article vise à documenter les taux de demandes chez les étudiants du niveau postsecondaire selon le niveau de revenu parental, ainsi qu’à réévaluer les tendances des taux d’inscription aux études postsecondaires selon le niveau de revenu parental compte tenu des taux de demandes inégaux. Ces tendances ont déjà été établies à l’aide de renseignements sur les crédits d’impôt dans les données fiscales. La présente étude utilise les données du Fichier des familles T1 (FFT1) et du Système d’information sur les étudiants postsecondaires (SIEP), qui ont récemment été couplés pour les dix provinces à partir de 2009.

    Date de diffusion : 2021-11-24

  • Articles et rapports : 36-28-0001202101100004
    Description :

    Bien que les femmes soient plus nombreuses que les hommes dans les établissements d’enseignement postsecondaire, elles sont considérablement moins susceptibles de choisir les domaines en science, technologie, génie et mathématiques (STGM) les mieux rémunérés, ce qui pourrait être un facteur dans l’écart salarial entre les hommes et les femmes. Bien que de nombreuses études aient examiné la sous-représentation persistante des femmes dans les programmes en STGM parmi les diplômés postsecondaires, l’objectif de la présente étude consiste à faire progresser les données probantes canadiennes de trois façons. Premièrement, l’étude fait la distinction entre deux types de différences selon le genre dans la probabilité de sélectionner des domaines liés aux STGM dans un programme de baccalauréat, soit ceux qui sont conditionnels à l’inscription à un programme de baccalauréat et ceux qui ne le sont pas. Deuxièmement, l’étude souligne les différences selon le genre dans certains programmes en STGM. Troisièmement, l’étude porte sur l’érosion importante de l’échantillon des enquêtes-ménages longitudinales qui ont été utilisées pour étudier la question dans plusieurs études antérieures. À cette fin, l’étude utilise un ensemble de données administratives qui fournissent des renseignements détaillés sur le rendement scolaire des élèves de la maternelle à la 12e année dans la troisième province la plus peuplée du Canada, la Colombie-Britannique.

    Date de diffusion : 2021-11-24

  • Articles et rapports : 89-657-X2021006
    Description :

    Ce feuillet présente l'évolution de 2001 à 2016 du nombre et de la proportion de jeunes enfants susceptibles de fréquenter un service de garde de langue française ainsi que du nombre et de la proportion de travailleurs des services de garde utilisant le français au travail au Canada hors Québec. Les données utilisées proviennent des recensements de la population de 2001 et 2016.

    Date de diffusion : 2021-11-18

  • Articles et rapports : 89-657-X2021007
    Description :

    Ce feuillet présente l'évolution de 2001 à 2016 du nombre et de la proportion de jeunes enfants susceptibles de fréquenter un service de garde de langue anglaise ainsi que du nombre et de la proportion de travailleurs des services de garde utilisant l'anglais au travail au Québec. Les données utilisées proviennent des recensements de la population de 2001 et 2016.

    Date de diffusion : 2021-11-18

  • Articles et rapports : 11-633-X2021007
    Description :

    Statistique Canada continue d’utiliser diverses sources de données pour fournir des variables au niveau des quartiers dans un ensemble croissant de domaines, comme les caractéristiques sociodémographiques, le revenu, les services et les commodités, la criminalité et l’environnement. Pourtant, malgré ces progrès, les renseignements sur les aspects sociaux des quartiers ne sont toujours pas disponibles. Dans le présent article, les réponses à l’Enquête sur la santé dans les collectivités canadiennes concernant le sentiment d’appartenance des répondants à leur communauté locale ont été regroupées pour les quatre années d’enquête allant de 2016 à 2019. Les réponses individuelles ont été agrégées au niveau du secteur de recensement (SR).

    Date de diffusion : 2021-11-16

  • Articles et rapports : 11-522-X202100100018
    Description : Le Centre des statistiques finlandais a commencé à publier des prévisions immédiates de l’indicateur de tendance de la production ou TIO (pour Trend Indicator of Output), l’indicateur mensuel de l’activité économique réelle, afin de répondre aux besoins des utilisateurs pendant la pandémie de COVID-19. Cet indicateur a été d’abord publié en avril 2020, au tout début de la pandémie en Finlande, et a depuis été publié chaque mois jusqu’en juin 2021. Les prévisions immédiates de l’indicateur TIO sont élaborées à l’aide de données de sources ouverte relatives aux volumes de circulation de camions à environ 100 points de mesure automatiques dans la région de Helsinki/Uusimaa ainsi qu’à l’aide de l’indicateur du climat économique pour la Finlande. L’estimation est effectuée à l’aide d’une approche d’apprentissage automatique et la méthodologie se fonde sur le travail réalisé antérieurement par le Centre des statistiques finlandais et ETLA Economic Research.

    Mots clés : prévisions immédiates; estimations rapides; apprentissage automatique; statistiques expérimentales.

    Date de diffusion : 2021-10-29

  • Articles et rapports : 11-522-X202100100025
    Description :

    Nous proposons une analyse longitudinale selon un point de vue lié aux changements organisationnels intervenus à l’Institut national italien de statistique ces dernières années. En 2016, l’Institut a mis en place une nouvelle direction, en vue d’uniformiser et de généraliser le processus opérationnel de la collecte de données conformément à la norme européenne du modèle GAMSO. Dans cette étude, nous discutons des avantages et des inconvénients de ce changement du point de vue de la participation aux enquêtes. L’analyse du taux de réponse aux enquêtes sur les TIC révèle une hausse d’environ 20 % depuis le début de la nouvelle organisation : le présent article tente de se concentrer sur les répercussions des changements apportés avec la nouvelle organisation. Nous nous sommes concentrés sur deux sous-ensembles donnés de répondants : celui appelé des « personnes recherchées », à savoir celles n’ayant jamais répondu à une enquête sur les TIC ni à toute autre enquête de l’ISTAT, d’une part, et le sous-ensemble des personnes dites « perdues », qui étaient incluses dans les échantillons de deux enquêtes consécutives et qui ont répondu à l’édition précédente, mais pas à l’édition actuelle. Cette étude vise à illustrer la façon dont l’organisation efficace de la collecte de données améliore les résultats de l’enquête ainsi que le type de mesures qui devraient être prises pour attirer l’attention des « personnes recherchées ». Enfin, nous appliquons un modèle logistique qui mesure la probabilité qu’une entreprise ayant répondu en 2018 (t-1) réponde également en 2019 (t). De plus, l’analyse suggère des mesures qui pourraient être prises pour améliorer la participation des répondants, la qualité des données ainsi que la perception qu’ont les répondants des statistiques officielles.

    Mots clés : stratégie de collecte des données; taux de réponse; paradonnées; fardeau de réponse; enquête sur les TIC.

    Date de diffusion : 2021-10-29

  • Articles et rapports : 11-522-X202100100005
    Description : Le Recensement de la population et des logements permanent est la nouvelle stratégie de recensement adoptée en Italie en 2018; il est fondé sur des registres statistiques combinés à des données recueillies au moyen d’enquêtes spécifiquement conçues pour améliorer la qualité des registres et garantir les produits du recensement. Le registre au cœur du recensement permanent est le registre de base de la population (RBP ou RBI en italien, pour Registro Base degli Individui), dont les principales sources administratives sont les registres locaux de la population. Les chiffres de la population sont déterminés par correction des données du RBI au moyen de coefficients basés sur les erreurs de couverture estimées à l’aide des données d’enquête, mais le besoin de sources administratives supplémentaires est clairement ressorti pendant le traitement des données recueillies pendant le premier cycle du recensement permanent. La suspension des enquêtes en raison de l’urgence de la pandémie, combinée à une réduction importante du budget du recensement pour les prochaines années, rend plus impératif encore de modifier le processus d’estimation afin d’utiliser les données administratives comme source principale. Un registre thématique a été mis en place afin d’exploiter toutes les sources administratives supplémentaires; la découverte de connaissances à partir de cette base de données est essentielle pour mettre en évidence les tendances pertinentes et créer de nouvelles dimensions, appelées « signes de vie », utiles pour l’estimation de la population. La disponibilité des données recueillies lors des deux premières vagues du recensement offre un ensemble unique et précieux aux fins d’apprentissage statistique; l’association entre les résultats d’enquête et les « signes de vie » pourrait servir à créer un modèle de classification permettant de prédire des erreurs de couverture dans le registre de base de la population (RBI). Le présent article présente les résultats du processus visant à produire des « signes de vie » qui se sont révélés importants dans l’estimation de la population.

    Mots clés : données administratives; recensement de la population; registres statistiques; découverte de connaissances à partir de bases de données.

    Date de diffusion : 2021-10-22

  • Articles et rapports : 11-522-X202100100014
    Description : De récents développements des modes d’administration de questionnaires et d’extraction de données ont favorisé l’utilisation d’échantillons non probabilistes, qui présentent souvent un biais de sélection découlant d’un manque de plan de sondage ou de l’autosélection des participants. Ce biais peut être traité par plusieurs ajustements, dont l’applicabilité dépend du type d’information auxiliaire disponible. Des poids de calage peuvent être utilisés lorsque seuls des totaux de population de variables auxiliaires sont disponibles. En cas de disponibilité d’une enquête de référence respectant un plan de sondage probabiliste, plusieurs méthodes peuvent être appliquées, comme l’ajustement sur le score de propension, l’appariement statistique ou l’imputation de masse, ainsi que des estimateurs doublement robustes. En cas de disponibilité d’un recensement complet de la population cible pour certaines covariables auxiliaires, des estimateurs fondés sur des modèles de superpopulation (souvent utilisés en échantillonnage probabiliste) peuvent être adaptés au cas d’échantillonnage non probabiliste. Nous avons étudié la combinaison de certaines de ces méthodes, afin de produire des estimations moins biaisées et plus efficaces, ainsi que l’utilisation de techniques de prédiction modernes (comme la classification par apprentissage automatique et des algorithmes de régression) dans les étapes de modélisation des ajustements décrits. Nous avons en outre étudié l’utilisation de techniques de sélection de variables avant l’étape de modélisation de l’ajustement sur le score de propension. Les résultats indiquent que les ajustements fondés sur la combinaison de plusieurs méthodes peuvent améliorer l’efficacité des estimations et que l’utilisation de l’apprentissage automatique et de techniques de sélection de variables peut contribuer à réduire le biais et la variance des estimateurs dans une plus grande mesure dans plusieurs situations.

    Mots clés : échantillonnage non probabiliste; calage; ajustement sur le score de propension; appariement.

    Date de diffusion : 2021-10-15

  • Articles et rapports : 11-522-X202100100019
    Description : Les organismes statistiques officiels doivent continuellement rechercher de nouvelles méthodes et techniques pouvant accroître l’efficacité des programmes et la pertinence des produits. La mesure de l’activité de construction qu’effectue l’U.S. Census Bureau (Bureau du recensement des États-Unis) est actuellement une entreprise qui exige beaucoup de ressources et qui repose lourdement sur la réponse aux enquêtes mensuelles au moyen de questionnaires et d’une collecte massive de données sur le terrain. Nos utilisateurs de données requièrent continuellement des produits de données plus actuels et plus détaillés, mais l’approche traditionnelle par enquête et le coût de collecte connexe, ainsi que le fardeau du répondant limitent notre capacité à répondre à ces besoins. En 2019, nous avons commencé des recherches pour savoir si l’application de techniques d’apprentissage automatique à l’imagerie satellitaire permettrait d’estimer de façon exacte les mises en chantier et les achèvements de logements, tout en respectant les échéances de l’indicateur mensuel existant, et ce, à un coût inférieur ou égal aux méthodes existantes. À l’aide des données historiques de l’enquête sur la construction du recensement en combinaison avec une imagerie satellitaire ciblée, l’équipe a entraîné, testé et validé deux réseaux neuronaux convolutifs capables de classer les images selon leur étape de construction, ce qui démontre la viabilité d’une approche fondée sur la science des données pour produire des mesures officielles de l’activité de construction.

    Mots clés : statistiques officielles; mises en chantier; apprentissage automatique; imagerie satellitaire.

    Date de diffusion : 2021-10-15
Revues et périodiques (0)

Revues et périodiques (0) (0 résultat)

Aucun contenu disponible actuellement

Date de modification :