Recherche par mot-clé

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Type

1 facets displayed. 1 facets selected.

Géographie

2 facets displayed. 0 facets selected.

Contenu

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (188)

Tout (188) (0 à 10 de 188 résultats)

  • Articles et rapports : 75F0002M2024005
    Description : Des améliorations ont été apportées aux méthodes et aux sources de données utilisées dans le cadre de l'Enquête canadienne sur le revenu (ECR) pour produire les estimations du revenu et de la pauvreté, lors de la diffusion des estimations pour l'année de référence 2022. La plus importante de ces améliorations est une augmentation significative de la taille de l'échantillon pour un grand sous-ensemble du contenu de l'ECR. La méthodologie de pondération a également été améliorée et la population cible de l'ECR est passée des personnes de 16 ans et plus aux personnes de 15 ans et plus. Cet article décrit les changements apportés et présente le résultat net approximatif de ces changements sur les estimations de revenu et sur la qualité des données de l'ECR, à l'aide des données de 2021. Les changements décrits dans le présent document mettent en évidence les façons dont la qualité des données a été améliorée tout en ayant de faibles répercussions sur les principales estimations et tendances de l'ECR.
    Date de diffusion : 2024-04-26

  • Articles et rapports : 11-522-X202200100010
    Description : Grandir au Québec est une enquête longitudinale populationnelle qui a débuté au printemps 2021 à l’Institut de la statistique du Québec. Parmi les enfants visés par ce suivi longitudinal, certains éprouveront des difficultés de développement à un moment ou un autre de leur vie. Ces mêmes enfants présentent souvent des caractéristiques associées à une érosion de l’échantillon plus élevée (famille à faible revenu, faible niveau de scolarisation des parents). Le présent article décrit les deux principaux défis que nous avons rencontrés en tentant d’assurer une représentativité suffisante de ces enfants, tant dans les résultats globaux que dans les analyses de sous-populations.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 12-001-X202300200007
    Description : La prédiction conforme est une méthode allégée en hypothèses servant à générer des intervalles ou des ensembles de prédiction sans distribution, pour des modèles prédictifs presque arbitraires, avec une couverture d’échantillon fini garantie. Les méthodes conformes sont un sujet de recherche dynamique en statistique et en apprentissage automatique, mais ce n’est que récemment qu’elles ont été étendues aux données non échangeables. Dans le présent article, nous invitons les méthodologistes d’enquête à commencer à utiliser des méthodes conformes et à y contribuer. Nous introduisons la façon dont la prédiction conforme peut être appliquée à des données provenant de plusieurs plans de sondage complexes courants dans un cadre d’inférence fondée sur le plan pour une population finie, et nous faisons ressortir des lacunes où les méthodologistes d’enquête pourraient appliquer leur expertise de façon fructueuse. Nos simulations confirment empiriquement les garanties théoriques de la couverture d’échantillon fini, et notre exemple de données réelles démontre la façon dont la prédiction conforme peut être appliquée aux données d’enquêtes-échantillons complexes.
    Date de diffusion : 2024-01-03

  • Articles et rapports : 75F0002M2023005
    Description : Lors de la diffusion des estimations pour l'année de référence 2021, des améliorations ont été apportées aux méthodes et aux systèmes utilisés dans le cadre de l'Enquête canadienne sur le revenu (ECR) pour produire les estimations du revenu. Cet article décrit les changements effectués et présente le résultat net approximatif de ces changements sur les estimations de revenu à l'aide des données de 2019 et de 2020. Les changements décrits dans cet article soulignent les façons dont la qualité des données a été améliorée, tout en ayant une incidence minimale sur les principales estimations et tendances de l'ECR.
    Date de diffusion : 2023-08-29

  • Articles et rapports : 12-001-X202100200008
    Description :

    Les enquêtes à bases de sondage multiples, dans lesquelles des échantillons probabilistes indépendants sont sélectionnés dans chacune des Q bases de sondage, servent depuis longtemps à améliorer la couverture, réduire les coûts ou augmenter la taille des échantillons de sous-populations d’intérêt. Une grande partie de la théorie a été développée en supposant que (1) l’union des bases de sondage couvre la population d’intérêt, (2) un échantillon probabiliste avec réponse complète est sélectionné dans chaque base de sondage, (3) les variables d’intérêt sont mesurées dans chaque échantillon sans erreur de mesure, et (4) il existe suffisamment d’information pour tenir compte du chevauchement des bases de sondage lors du calcul des estimations. Après avoir passé en revue la conception, l’estimation et le calage des enquêtes effectuées à partir de bases de sondage multiples traditionnelles, je considère des modifications aux hypothèses qui permettent à une structure de bases de sondage multiples de servir de principe d’organisation pour d’autres méthodes de combinaison de données telles que l’imputation massive, l’appariement d’échantillons, l’estimation sur petits domaines et l’estimation par techniques de saisie-ressaisie. Enfin, je discute la façon dont les résultats de la recherche sur les enquêtes à l’aide de bases de sondage multiples peuvent être utilisés lors de la conception et de l’évaluation des systèmes de collecte de données qui intègrent plusieurs sources de données.

    Date de diffusion : 2022-01-06

  • Articles et rapports : 89-648-X2020004
    Description :

    Le présent rapport technique a pour but de valider le module de la sécurité alimentaire de l'Étude longitudinale et internationale des adultes (ELIA) de 2018 (vague 4) et de fournir des recommandations qui seront utilisées aux fins d’analyse. La section 2 du rapport donne un aperçu des données de l’ELIA. La section 3 donne des renseignements de base quant aux mesures de la sécurité alimentaire dans les enquêtes nationales et explique pourquoi ces mesures sont importantes dans la documentation actuelle. La section 4 offre une analyse des données relatives à la sécurité alimentaire en présentant des statistiques descriptives clés et des contrôles logiques faisant appel à la méthodologie de l'ELIA et à des renseignements fournis par des chercheurs externes. Dans la section 5, la validation de certification a été effectuée en comparant d'autres enquêtes nationales canadiennes qui ont utilisé un module de la sécurité alimentaire avec le module utilisé dans l’ELIA. Enfin, la section 6 présente les observations clés et leur incidence quant à l’ELIA.

    Date de diffusion : 2020-11-02

  • Articles et rapports : 12-001-X201900200008
    Description :

    De nos jours, il y a une non-réponse élevée dans de nombreuses enquêtes-échantillons, y compris d’importantes enquêtes menées par des organismes statistiques gouvernementaux. Une collecte de données adaptative peut être avantageuse dans cette situation : il est possible de réduire le biais de non-réponse dans les estimations de l’enquête, jusqu’à un certain point, en produisant un ensemble de répondants bien équilibré. Les variables auxiliaires ont un double objectif. Utilisées au cours de la phase d’estimation, elles réduisent le biais, sans toutefois l’éliminer complètement, par une pondération ajustée par calage. Au cours de la phase précédente de collecte de données adaptative, les variables auxiliaires jouent également un rôle important : elles contribuent à réduire le déséquilibre dans l’ensemble final de répondants. Dans le contexte de cette utilisation combinée de variables auxiliaires, le présent article est consacré à un examen de l’écart entre l’estimation par calage et l’estimation sans biais (réponse complète). Nous montrons que cet écart est la somme de deux composantes. La composante réductible peut être réduite, par la collecte de données adaptative, jusqu’à zéro si une réponse parfaitement équilibrée est obtenue par rapport à un vecteur auxiliaire choisi. En revanche, la composante résistante ne varie pas ou varie peu sous l’effet d’une réponse mieux équilibrée; elle représente une partie de l’écart qu’un plan adaptatif ne permet pas d’éliminer. La taille relative de cette première composante est un indicateur de l’avantage qu’on peut tirer d’un plan de sondage adaptatif.

    Date de diffusion : 2019-06-27

  • Articles et rapports : 12-001-X201800254954
    Description :

    Ces dernières années, les techniques d’échantillonnage équilibré ont suscité un regain d’intérêt. Ces techniques contraignent les estimateurs d’Horvitz-Thompson des totaux des variables auxiliaires a égaler, du moins approximativement, les totaux vrais correspondants, pour éviter la présence de mauvais échantillons. Plusieurs procédures existent pour exécuter l’échantillonnage équilibré, dont la méthode du cube, élaborée par Deville et Tillé (2004), et l’algorithme réjectif, introduit par Hájek (1964). Après un bref examen de ces méthodes d’échantillonnage, motivé par la planification d’une enquête auprès des pêcheurs sportifs, nous étudions par simulations Monte Carlo les plans de sondage produits par ces deux algorithmes d’échantillonnage.

    Date de diffusion : 2018-12-20

  • Articles et rapports : 82-003-X201600414490
    Description :

    La présente analyse examine les associations entre la marche et le vélo utilitaires, d’une part, et les mesures objectives de l’activité physique, de la composition corporelle, de la condition physique et des facteurs de risque de maladie cardiovasculaire, d’autre part, dans un échantillon représentatif de la population canadienne de 20 à 79 ans.

    Date de diffusion : 2016-04-20

  • Articles et rapports : 12-001-X201500214229
    Description :

    L’estimation autopondérée au moyen de méthodes d’échantillonnage avec probabilités égales (epsem pour equal probability selection methods) est souhaitable pour des raisons d’efficacité relativement à la variance. Habituellement, pour obtenir la propriété epsem pour des plans de sondage à deux degrés (et à une phase) en vue d’estimer des paramètres au niveau de la population, on utilise le chiffre de population de chaque unité primaire d’échantillonnage (UPE) comme mesure de taille pour la sélection des UPE, ainsi que l’attribution d’une taille d’échantillon égale aux UPE sous échantillonnage aléatoire simple (EAS) des unités élémentaires. Cependant, si l’on souhaite des estimations autopondérées pour les paramètres correspondant à de multiples domaines sous une répartition préétablie de l’échantillon entre les domaines, Folsom, Potter et Williams (1987) ont montré que l’on peut utiliser une mesure composite de taille pour sélectionner les UPE afin d’obtenir des plans epsem quand on suppose qu’outre les chiffres de population des UPE au niveau des domaines (c’est à dire la répartition de la population entre les domaines dans les UPE), les identificateurs de domaines pour les unités élémentaires sont également disponibles dans la base de sondage. Le terme depsem-A sera utilisé pour désigner ce genre de plan de sondage à deux degrés (et à une phase) pour obtenir l’estimation epsem au niveau du domaine. Folsom et coll. ont également considéré des plans d’échantillonnage à deux phases et à deux degrés quand les chiffres de population des UPE au niveau des domaines sont inconnus, mais que les dénombrements d’UPE entières sont connus. Pour ces plans (que nous désignerons depsem-B) avec les UPE sélectionnées avec probabilité proportionnelle à la mesure de taille habituelle (c’est à dire la population totale de l’UPE) au premier degré, toutes les unités élémentaires dans chaque UPE sélectionnée font d’abord l’objet d’une présélection en vue de les classer par domaine à la première phase de collecte des données, avant la sélection par EAS au deuxième degré d’échantillonnage. Des échantillons stratifiés par domaine sont ensuite sélectionnés dans les UPE en appliquant des taux d’échantillonnage de domaine choisis de manière appropriée pour que les tailles d’échantillon de domaine obtenues soient celles souhaitées et que le plan d’échantillonnage résultant soit autopondéré. Dans le présent article, nous commençons par donner une justification simple des mesures composites de taille pour le plan depsem-A et des taux d’échantillonnage de domaine pour le plan depsem-B. Puis, pour les plans depsem-A et -B, nous proposons des généralisations, premièrement aux cas pour lesquels les identificateurs de domaine pour les unités élémentaires ne sont pas disponibles dans la base de sondage et les chiffres de population des UPE au niveau des domaines ne sont connus qu’approximativement à partir d’autres sources, et deuxièmement, aux cas pour lesquels les mesures de taille des UPE sont préétablies en se basant sur d’autres considérations pratiques et souhaitables de suréchantillonnage ou de sous-échantillonnage de certains domaines. Nous présentons aussi une généralisation supplémentaire en présence de sous-échantillonnage des unités élémentaires et de non-réponse dans certaines UPE à la première phase, avant la sélection des unités élémentaires de deuxième phase dans les domaines à l’intérieur de chaque UPE sélectionnée. Cette dernière généralisation du plan depsem-B est illustrée pour un échantillon aréolaire de logements.

    Date de diffusion : 2015-12-17
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (188)

Analyses (188) (0 à 10 de 188 résultats)

  • Articles et rapports : 75F0002M2024005
    Description : Des améliorations ont été apportées aux méthodes et aux sources de données utilisées dans le cadre de l'Enquête canadienne sur le revenu (ECR) pour produire les estimations du revenu et de la pauvreté, lors de la diffusion des estimations pour l'année de référence 2022. La plus importante de ces améliorations est une augmentation significative de la taille de l'échantillon pour un grand sous-ensemble du contenu de l'ECR. La méthodologie de pondération a également été améliorée et la population cible de l'ECR est passée des personnes de 16 ans et plus aux personnes de 15 ans et plus. Cet article décrit les changements apportés et présente le résultat net approximatif de ces changements sur les estimations de revenu et sur la qualité des données de l'ECR, à l'aide des données de 2021. Les changements décrits dans le présent document mettent en évidence les façons dont la qualité des données a été améliorée tout en ayant de faibles répercussions sur les principales estimations et tendances de l'ECR.
    Date de diffusion : 2024-04-26

  • Articles et rapports : 11-522-X202200100010
    Description : Grandir au Québec est une enquête longitudinale populationnelle qui a débuté au printemps 2021 à l’Institut de la statistique du Québec. Parmi les enfants visés par ce suivi longitudinal, certains éprouveront des difficultés de développement à un moment ou un autre de leur vie. Ces mêmes enfants présentent souvent des caractéristiques associées à une érosion de l’échantillon plus élevée (famille à faible revenu, faible niveau de scolarisation des parents). Le présent article décrit les deux principaux défis que nous avons rencontrés en tentant d’assurer une représentativité suffisante de ces enfants, tant dans les résultats globaux que dans les analyses de sous-populations.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 12-001-X202300200007
    Description : La prédiction conforme est une méthode allégée en hypothèses servant à générer des intervalles ou des ensembles de prédiction sans distribution, pour des modèles prédictifs presque arbitraires, avec une couverture d’échantillon fini garantie. Les méthodes conformes sont un sujet de recherche dynamique en statistique et en apprentissage automatique, mais ce n’est que récemment qu’elles ont été étendues aux données non échangeables. Dans le présent article, nous invitons les méthodologistes d’enquête à commencer à utiliser des méthodes conformes et à y contribuer. Nous introduisons la façon dont la prédiction conforme peut être appliquée à des données provenant de plusieurs plans de sondage complexes courants dans un cadre d’inférence fondée sur le plan pour une population finie, et nous faisons ressortir des lacunes où les méthodologistes d’enquête pourraient appliquer leur expertise de façon fructueuse. Nos simulations confirment empiriquement les garanties théoriques de la couverture d’échantillon fini, et notre exemple de données réelles démontre la façon dont la prédiction conforme peut être appliquée aux données d’enquêtes-échantillons complexes.
    Date de diffusion : 2024-01-03

  • Articles et rapports : 75F0002M2023005
    Description : Lors de la diffusion des estimations pour l'année de référence 2021, des améliorations ont été apportées aux méthodes et aux systèmes utilisés dans le cadre de l'Enquête canadienne sur le revenu (ECR) pour produire les estimations du revenu. Cet article décrit les changements effectués et présente le résultat net approximatif de ces changements sur les estimations de revenu à l'aide des données de 2019 et de 2020. Les changements décrits dans cet article soulignent les façons dont la qualité des données a été améliorée, tout en ayant une incidence minimale sur les principales estimations et tendances de l'ECR.
    Date de diffusion : 2023-08-29

  • Articles et rapports : 12-001-X202100200008
    Description :

    Les enquêtes à bases de sondage multiples, dans lesquelles des échantillons probabilistes indépendants sont sélectionnés dans chacune des Q bases de sondage, servent depuis longtemps à améliorer la couverture, réduire les coûts ou augmenter la taille des échantillons de sous-populations d’intérêt. Une grande partie de la théorie a été développée en supposant que (1) l’union des bases de sondage couvre la population d’intérêt, (2) un échantillon probabiliste avec réponse complète est sélectionné dans chaque base de sondage, (3) les variables d’intérêt sont mesurées dans chaque échantillon sans erreur de mesure, et (4) il existe suffisamment d’information pour tenir compte du chevauchement des bases de sondage lors du calcul des estimations. Après avoir passé en revue la conception, l’estimation et le calage des enquêtes effectuées à partir de bases de sondage multiples traditionnelles, je considère des modifications aux hypothèses qui permettent à une structure de bases de sondage multiples de servir de principe d’organisation pour d’autres méthodes de combinaison de données telles que l’imputation massive, l’appariement d’échantillons, l’estimation sur petits domaines et l’estimation par techniques de saisie-ressaisie. Enfin, je discute la façon dont les résultats de la recherche sur les enquêtes à l’aide de bases de sondage multiples peuvent être utilisés lors de la conception et de l’évaluation des systèmes de collecte de données qui intègrent plusieurs sources de données.

    Date de diffusion : 2022-01-06

  • Articles et rapports : 89-648-X2020004
    Description :

    Le présent rapport technique a pour but de valider le module de la sécurité alimentaire de l'Étude longitudinale et internationale des adultes (ELIA) de 2018 (vague 4) et de fournir des recommandations qui seront utilisées aux fins d’analyse. La section 2 du rapport donne un aperçu des données de l’ELIA. La section 3 donne des renseignements de base quant aux mesures de la sécurité alimentaire dans les enquêtes nationales et explique pourquoi ces mesures sont importantes dans la documentation actuelle. La section 4 offre une analyse des données relatives à la sécurité alimentaire en présentant des statistiques descriptives clés et des contrôles logiques faisant appel à la méthodologie de l'ELIA et à des renseignements fournis par des chercheurs externes. Dans la section 5, la validation de certification a été effectuée en comparant d'autres enquêtes nationales canadiennes qui ont utilisé un module de la sécurité alimentaire avec le module utilisé dans l’ELIA. Enfin, la section 6 présente les observations clés et leur incidence quant à l’ELIA.

    Date de diffusion : 2020-11-02

  • Articles et rapports : 12-001-X201900200008
    Description :

    De nos jours, il y a une non-réponse élevée dans de nombreuses enquêtes-échantillons, y compris d’importantes enquêtes menées par des organismes statistiques gouvernementaux. Une collecte de données adaptative peut être avantageuse dans cette situation : il est possible de réduire le biais de non-réponse dans les estimations de l’enquête, jusqu’à un certain point, en produisant un ensemble de répondants bien équilibré. Les variables auxiliaires ont un double objectif. Utilisées au cours de la phase d’estimation, elles réduisent le biais, sans toutefois l’éliminer complètement, par une pondération ajustée par calage. Au cours de la phase précédente de collecte de données adaptative, les variables auxiliaires jouent également un rôle important : elles contribuent à réduire le déséquilibre dans l’ensemble final de répondants. Dans le contexte de cette utilisation combinée de variables auxiliaires, le présent article est consacré à un examen de l’écart entre l’estimation par calage et l’estimation sans biais (réponse complète). Nous montrons que cet écart est la somme de deux composantes. La composante réductible peut être réduite, par la collecte de données adaptative, jusqu’à zéro si une réponse parfaitement équilibrée est obtenue par rapport à un vecteur auxiliaire choisi. En revanche, la composante résistante ne varie pas ou varie peu sous l’effet d’une réponse mieux équilibrée; elle représente une partie de l’écart qu’un plan adaptatif ne permet pas d’éliminer. La taille relative de cette première composante est un indicateur de l’avantage qu’on peut tirer d’un plan de sondage adaptatif.

    Date de diffusion : 2019-06-27

  • Articles et rapports : 12-001-X201800254954
    Description :

    Ces dernières années, les techniques d’échantillonnage équilibré ont suscité un regain d’intérêt. Ces techniques contraignent les estimateurs d’Horvitz-Thompson des totaux des variables auxiliaires a égaler, du moins approximativement, les totaux vrais correspondants, pour éviter la présence de mauvais échantillons. Plusieurs procédures existent pour exécuter l’échantillonnage équilibré, dont la méthode du cube, élaborée par Deville et Tillé (2004), et l’algorithme réjectif, introduit par Hájek (1964). Après un bref examen de ces méthodes d’échantillonnage, motivé par la planification d’une enquête auprès des pêcheurs sportifs, nous étudions par simulations Monte Carlo les plans de sondage produits par ces deux algorithmes d’échantillonnage.

    Date de diffusion : 2018-12-20

  • Articles et rapports : 82-003-X201600414490
    Description :

    La présente analyse examine les associations entre la marche et le vélo utilitaires, d’une part, et les mesures objectives de l’activité physique, de la composition corporelle, de la condition physique et des facteurs de risque de maladie cardiovasculaire, d’autre part, dans un échantillon représentatif de la population canadienne de 20 à 79 ans.

    Date de diffusion : 2016-04-20

  • Articles et rapports : 12-001-X201500214229
    Description :

    L’estimation autopondérée au moyen de méthodes d’échantillonnage avec probabilités égales (epsem pour equal probability selection methods) est souhaitable pour des raisons d’efficacité relativement à la variance. Habituellement, pour obtenir la propriété epsem pour des plans de sondage à deux degrés (et à une phase) en vue d’estimer des paramètres au niveau de la population, on utilise le chiffre de population de chaque unité primaire d’échantillonnage (UPE) comme mesure de taille pour la sélection des UPE, ainsi que l’attribution d’une taille d’échantillon égale aux UPE sous échantillonnage aléatoire simple (EAS) des unités élémentaires. Cependant, si l’on souhaite des estimations autopondérées pour les paramètres correspondant à de multiples domaines sous une répartition préétablie de l’échantillon entre les domaines, Folsom, Potter et Williams (1987) ont montré que l’on peut utiliser une mesure composite de taille pour sélectionner les UPE afin d’obtenir des plans epsem quand on suppose qu’outre les chiffres de population des UPE au niveau des domaines (c’est à dire la répartition de la population entre les domaines dans les UPE), les identificateurs de domaines pour les unités élémentaires sont également disponibles dans la base de sondage. Le terme depsem-A sera utilisé pour désigner ce genre de plan de sondage à deux degrés (et à une phase) pour obtenir l’estimation epsem au niveau du domaine. Folsom et coll. ont également considéré des plans d’échantillonnage à deux phases et à deux degrés quand les chiffres de population des UPE au niveau des domaines sont inconnus, mais que les dénombrements d’UPE entières sont connus. Pour ces plans (que nous désignerons depsem-B) avec les UPE sélectionnées avec probabilité proportionnelle à la mesure de taille habituelle (c’est à dire la population totale de l’UPE) au premier degré, toutes les unités élémentaires dans chaque UPE sélectionnée font d’abord l’objet d’une présélection en vue de les classer par domaine à la première phase de collecte des données, avant la sélection par EAS au deuxième degré d’échantillonnage. Des échantillons stratifiés par domaine sont ensuite sélectionnés dans les UPE en appliquant des taux d’échantillonnage de domaine choisis de manière appropriée pour que les tailles d’échantillon de domaine obtenues soient celles souhaitées et que le plan d’échantillonnage résultant soit autopondéré. Dans le présent article, nous commençons par donner une justification simple des mesures composites de taille pour le plan depsem-A et des taux d’échantillonnage de domaine pour le plan depsem-B. Puis, pour les plans depsem-A et -B, nous proposons des généralisations, premièrement aux cas pour lesquels les identificateurs de domaine pour les unités élémentaires ne sont pas disponibles dans la base de sondage et les chiffres de population des UPE au niveau des domaines ne sont connus qu’approximativement à partir d’autres sources, et deuxièmement, aux cas pour lesquels les mesures de taille des UPE sont préétablies en se basant sur d’autres considérations pratiques et souhaitables de suréchantillonnage ou de sous-échantillonnage de certains domaines. Nous présentons aussi une généralisation supplémentaire en présence de sous-échantillonnage des unités élémentaires et de non-réponse dans certaines UPE à la première phase, avant la sélection des unités élémentaires de deuxième phase dans les domaines à l’intérieur de chaque UPE sélectionnée. Cette dernière généralisation du plan depsem-B est illustrée pour un échantillon aréolaire de logements.

    Date de diffusion : 2015-12-17
Références (0)

Références (0) (0 résultat)

Aucun contenu disponible actuellement

Date de modification :