Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Auteur(s)

186 facets displayed. 1 facets selected.

Contenu

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (300)

Tout (300) (0 à 10 de 300 résultats)

  • Stats en bref : 89-20-00062024001
    Description : Cette courte vidéo explique comment cela peut être très efficace pour tous les ordres de gouvernement et toutes les organisations au service des collectivités d'utiliser des données désagrégées pour prendre des décisions de politique publique, fondées sur les données probantes. En utilisant des données désagrégées, les décideurs sont en mesure de concevoir des politiques plus appropriées et plus efficaces qui répondent aux besoins de chaque Canadien différent et unique.
    Date de diffusion : 2024-07-16

  • Stats en bref : 89-20-00062024002
    Description : Cette courte vidéo explique comment l'utilisation de données désagrégées peut aider les décideurs à élaborer des politiques plus ciblées et plus efficaces, puisqu'ils seront en mesure de cerner les besoins et les défis uniques des différents groupes démographiques.
    Date de diffusion : 2024-07-16

  • Articles et rapports : 12-001-X202400100001
    Description : Inspirés par les deux excellentes discussions de notre article, nous offrons un regard nouveau et présentons de nouvelles avancées sur le problème de l’estimation des probabilités de participation pour des échantillons non probabilistes. Tout d’abord, nous proposons une amélioration de la méthode de Chen, Li et Wu (2020), fondée sur la théorie de la meilleure estimation linéaire sans biais, qui tire plus efficacement parti des données disponibles des échantillons probabiliste et non probabiliste. De plus, nous élaborons une méthode de vraisemblance de l’échantillon, dont l’idée est semblable à la méthode d’Elliott (2009), qui tient adéquatement compte du chevauchement entre les deux échantillons quand il est possible de l’identifier dans au moins un des échantillons. Nous utilisons la théorie de la meilleure prédiction linéaire sans biais pour traiter le scénario où le chevauchement est inconnu. Il est intéressant de constater que les deux méthodes que nous proposons coïncident quand le chevauchement est inconnu. Ensuite, nous montrons que de nombreuses méthodes existantes peuvent être obtenues comme cas particulier d’une fonction d’estimation sans biais générale. Enfin, nous concluons en formulant quelques commentaires sur l’estimation non paramétrique des probabilités de participation.
    Date de diffusion : 2024-06-25

  • Articles et rapports : 12-001-X202400100003
    Description : Beaumont, Bosa, Brennan, Charlebois et Chu (2024) proposent des méthodes novatrices de sélection de modèles aux fins d’estimation des probabilités de participation pour des unités d’échantillonnage non probabiliste. Notre examen portera principalement sur le choix de la vraisemblance et du paramétrage du modèle, qui sont essentiels à l’efficacité des techniques proposées dans l’article. Nous examinons d’autres méthodes fondées sur la vraisemblance et la pseudo-vraisemblance pour estimer les probabilités de participation et nous présentons des simulations mettant en œuvre et comparant la sélection de variables fondée sur le critère d’information d’Akaike (AIC). Nous démontrons que, dans des scénarios pratiques importants, la méthode fondée sur une vraisemblance formulée sur les échantillons non probabiliste et probabiliste groupés qui sont observés offre un meilleur rendement que les autres solutions fondées sur la pseudo-vraisemblance. La différence de sensibilité du AIC est particulièrement grande en cas de petites tailles de l’échantillon probabiliste et de petit chevauchement dans les domaines de covariables.
    Date de diffusion : 2024-06-25

  • Articles et rapports : 12-001-X202400100004
    Description : Les organismes nationaux de statistique étudient de plus en plus la possibilité d’utiliser des échantillons non probabilistes comme solution de rechange aux échantillons probabilistes. Toutefois, il est bien connu que l’utilisation d’un échantillon non probabiliste seul peut produire des estimations présentant un biais important en raison de la nature inconnue du mécanisme de sélection sous-jacent. Il est possible de réduire le biais en intégrant les données de l’échantillon non probabiliste aux données d’un échantillon probabiliste, à condition que les deux échantillons contiennent des variables auxiliaires communes. Nous nous concentrons sur les méthodes de pondération par l’inverse de la probabilité, lesquelles consistent à modéliser la probabilité de participation à l’échantillon non probabiliste. Premièrement, nous examinons le modèle logistique ainsi que l’estimation par la méthode du pseudo maximum de vraisemblance. Nous proposons une procédure de sélection de variables en fonction d’un critère d’information d’Akaike (AIC) modifié qui tient compte de la structure des données et du plan d’échantillonnage probabiliste. Nous proposons également une méthode simple fondée sur le rang pour former des strates a posteriori homogènes. Ensuite, nous adaptons l’algorithme des arbres de classification et de régression (CART) à ce scénario d’intégration de données, tout en tenant compte, encore une fois, du plan d’échantillonnage probabiliste. Nous proposons un estimateur de la variance bootstrap qui tient compte de deux sources de variabilité : le plan d’échantillonnage probabiliste et le modèle de participation. Nos méthodes sont illustrées au moyen de données recueillies par approche participative et de données d’enquête de Statistique Canada.
    Date de diffusion : 2024-06-25

  • Articles et rapports : 12-001-X202400100012
    Description : Devenue populaire pour certains types de projets de recherche par enquête, l’utilisation d’échantillons non probabilistes est rapide et peu coûteuse. Kennedy, Mercer et Lau examinent certains problèmes de qualité des données associés aux échantillons non probabilistes des panels volontaires, un type d’échantillon fréquemment utilisé aux États-Unis. Les auteurs montrent que les estimations obtenues à partir de ces échantillons posent de graves problèmes qui vont au-delà de la représentativité. Afin de bien évaluer tous les types d’enquêtes qui existent, il est important d’adopter le point de vue de l’erreur d’enquête totale.
    Date de diffusion : 2024-06-25

  • Articles et rapports : 11-522-X202200100008
    Description : La publication de davantage de données présentant un niveau élevé de désagrégation peut accroître la transparence et fournir des renseignements importants sur les groupes sous-représentés. L’élaboration d’options d’accès plus facilement disponibles augmente la quantité d’information disponible et produite par les chercheurs. Accroître l’étendue et la profondeur de l’information diffusée permet une meilleure représentation de la population canadienne, mais impose également à Statistique Canada une plus grande responsabilité quant à la manière dont cela est fait, qui se doit de préserver la confidentialité; il est donc utile d’élaborer des outils qui nous permettent de quantifier le risque lié à la granularité accrue des données. Afin d’évaluer le risque d’une attaque par reconstruction de base de données sur les données de recensement publiées par Statistique Canada, nous appliquons la stratégie de l’U.S. Census Bureau, qui met en avant une méthode utilisant un solveur de satisfaisabilité booléenne (SAT) pour reconstruire les attributs individuels des résidents d’un îlot hypothétique du recensement américain, basé uniquement sur un tableau de statistiques récapitulatives. Nous prévoyons d’étendre cette technique pour tenter de reconstruire une petite fraction des microdonnées de recensement de Statistique Canada. Dans cet article, nous aborderons nos conclusions, les défis liés à l’élaboration d’une attaque par reconstruction et l’effet d’une mesure de confidentialité existante pour atténuer ces attaques. En outre, nous comparerons notre stratégie actuelle à d’autres méthodes potentielles utilisées aux fins de protection des données, en particulier la publication de données tabulaires perturbées par un mécanisme aléatoire, tel que la confidentialité différentielle.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100009
    Description : L’éducation et la formation sont reconnues comme des éléments fondamentaux du développement d’une société. Il s’agit d’un phénomène multidimensionnel complexe, dont les déterminants sont attribuables à plusieurs conditions sociales et socioéconomiques interdépendantes. Pour répondre à la demande de renseignements statistiques à l’appui de l’élaboration des politiques et de leurs processus de suivi et d’évaluation, l’Institut national italien de statistique (Istat) renouvelle le système de production de statistiques sur l’éducation et la formation en mettant en œuvre un nouveau registre statistique thématique. Ce dernier fera partie du système intégré de registres de l’Istat, ce qui permettra de relier le phénomène de l’éducation et de la formation à d’autres phénomènes pertinents, comme la transition vers le marché du travail.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100011
    Description : En 2021, Statistique Canada a lancé le Plan d’action sur les données désagrégées, une initiative pluriannuelle pour renforcer les méthodes de collecte de données en les rendant plus représentatives, améliorer les statistiques sur diverses populations afin de mener des analyses intersectionnelles et appuyer les efforts du gouvernement et de la société visant à atténuer les inégalités connues et à intégrer les facteurs d’égalité et d’inclusion dans la prise de décisions. Dans le cadre de cette initiative, nous montons la Série d’enquêtes sur les gens et leurs communautés, un nouveau panel probabiliste conçu précisément pour recueillir des données qui peuvent être désagrégées selon le groupe racisé. Ce nouvel outil nous permettra de combler des lacunes dans les données et de répondre aux nouvelles questions relatives à la diversité. L’article présentera un aperçu de la conception de la Série d’enquêtes sur les gens et leurs communautés.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 12-001-X202300200003
    Description : Nous étudions la prédiction sur petits domaines des paramètres généraux à partir de deux modèles pour les dénombrements au niveau de l’unité. Nous construisons des prédicteurs de paramètres, comme les quartiles, qui peuvent être des fonctions non linéaires de la variable réponse du modèle. Nous élaborons d’abord une procédure pour construire les meilleurs prédicteurs empiriques et les estimateurs de l’erreur quadratique moyenne des paramètres généraux dans un modèle Gamma-Poisson au niveau de l’unité. Nous utilisons ensuite un algorithme de rééchantillonnage préférentiel pour élaborer des prédicteurs pour un modèle linéaire mixte généralisé (MLMG) avec une distribution de la réponse de Poisson. Nous comparons les deux modèles au moyen d’une simulation et d’une analyse des données de l’Iowa Seat-Belt Use Survey (une enquête sur l’utilisation de la ceinture de sécurité dans l’État de l’Iowa).
    Date de diffusion : 2024-01-03
Stats en bref (5)

Stats en bref (5) ((5 résultats))

  • Stats en bref : 89-20-00062024001
    Description : Cette courte vidéo explique comment cela peut être très efficace pour tous les ordres de gouvernement et toutes les organisations au service des collectivités d'utiliser des données désagrégées pour prendre des décisions de politique publique, fondées sur les données probantes. En utilisant des données désagrégées, les décideurs sont en mesure de concevoir des politiques plus appropriées et plus efficaces qui répondent aux besoins de chaque Canadien différent et unique.
    Date de diffusion : 2024-07-16

  • Stats en bref : 89-20-00062024002
    Description : Cette courte vidéo explique comment l'utilisation de données désagrégées peut aider les décideurs à élaborer des politiques plus ciblées et plus efficaces, puisqu'ils seront en mesure de cerner les besoins et les défis uniques des différents groupes démographiques.
    Date de diffusion : 2024-07-16

  • Stats en bref : 89-20-00062023001
    Description : Ce cours s’adresse aux employés du gouvernement du Canada qui veulent apprendre à évaluer la qualité des données pour un usage particulier. Que vous soyez un employé souhaitant apprendre les bases du sujet ou un spécialiste du domaine cherchant à perfectionner ses compétences, ce cours pourra vous être utile.
    Date de diffusion : 2023-07-17

  • Stats en bref : 11-627-M2022016
    Description :

    Cette infographie explique les étapes de la collecte des données pour toutes les enquêtes de Statistique Canada sur les ménages et les entreprises. Les réponses sont compilées, analysées et utilisées pour prendre des décisions importantes et sont gardées strictement confidentielles.

    Date de diffusion : 2022-02-28

  • Stats en bref : 13-604-M2007056
    Description :

    Ce document met en lumière la récente mise en place du Compte satellite de recherche et de développement élaboré par Statistique Canada. Le CSRD fournit une analyse de la capitalisation de la recherche et du développement (R et D) suivant les lignes directrices internationales pour le Système des comptes nationaux. Diverses méthodes de calcul mesurent l'impact des dépenses en recherche et développement sur le Produit intérieur brut du Canada. Ce document fournit les résultats du CSRD pour les années 1997 à 2004.

    Date de diffusion : 2008-05-30
Articles et rapports (294)

Articles et rapports (294) (10 à 20 de 294 résultats)

  • Articles et rapports : 11-633-X2023003
    Description : Ce document couvre les travaux universitaires et les stratégies d’estimation utilisées par les organismes nationaux de statistique. Il aborde la question de la production d’estimations géographiques détaillées au niveau du quadrillage pour le Canada en étudiant la mesure du produit intérieur brut infraprovincial et infraterritorial à l’aide du Yukon comme scénario d’essai.
    Date de diffusion : 2023-12-15

  • Articles et rapports : 12-001-X202300100010
    Description : Des estimations précises et sans biais des propensions à répondre (PR) jouent un rôle décisif dans l’observation, l’analyse et l’adaptation d’une collecte de données. Dans un environnement d’enquête fixe, ces paramètres sont stables et leurs estimations finissent par converger lorsque suffisamment de données historiques sont recueillies. Dans les pratiques d’enquête, toutefois, les taux de réponse varient progressivement dans le temps. Comprendre la variation temporelle de la prédiction des taux de réponse est essentiel lors de l’adaptation d’un plan d’enquête. La présente étude met en lumière la variation temporelle des taux de réponse au moyen de modèles hiérarchiques (à plusieurs niveaux) de séries chronologiques. Il est possible de générer des prédictions fiables en apprenant à partir de séries chronologiques historiques et de mises à jour avec de nouvelles données dans un cadre bayésien. Pour illustrer une étude de cas, nous nous concentrons sur des taux de réponse en ligne dans le cadre de l’enquête sur la santé réalisée aux Pays-Bas de 2014 à 2019.
    Date de diffusion : 2023-06-30

  • Articles et rapports : 12-001-X202300100011
    Description : La définition des unités statistiques est une question récurrente dans le domaine des enquêtes-échantillons. En effet, les populations sondées ne comportent pas toutes une base de sondage déjà disponible. Dans certaines populations, les unités échantillonnées sont différentes des unités d’observation, et la production d’estimations concernant la population d’intérêt soulève des questions complexes qu’il est possible de traiter en utilisant la méthode de partage des poids (Deville et Lavallée, 2006). Les deux populations prises en considération dans cette méthode sont toutefois discrètes. Dans certains champs d’études, la population échantillonnée est continue : c’est, par exemple, le cas des inventaires forestiers dans lesquels, souvent, les arbres sondés sont ceux situés sur des parcelles de terrain dont les centres sont des points tirés aléatoirement dans un secteur donné. La production d’estimations statistiques à partir de l’échantillon d’arbres sondés présente des difficultés d’ordre méthodologique, tout comme les calculs de variance qui y sont associés. Le présent article a pour but d’étendre la méthode de partage des poids au cas de populations continues (population échantillonnée) et de populations discrètes (population sondée), à partir de l’extension proposée par Cordy (1993) de l’estimateur de Horvitz-Thompson pour procéder à un tirage de points dans un univers continu.
    Date de diffusion : 2023-06-30

  • Articles et rapports : 36-28-0001202300100003
    Description : Les recherches sur la qualité de vie et le bien-être comportent souvent du contenu d’enquête de nature subjective, comme des questions portant sur la satisfaction à l’égard de la vie. Deux aspects ayant une incidence sur les réponses liées à la satisfaction autodéclarée à l’égard de la vie sont étudiés dans diverses enquêtes sociales : l’effet de la base de sondage (la réponse du répondant est influencée par le thème de l’enquête ou son contenu) et l’effet du mode d’enquête (la réponse du répondant est influencée par la méthode de collecte des données — avec un intervieweur, au moyen d’un portail de collecte en ligne, etc.). Cet article vise à documenter l’effet de la collecte de données et du contenu de l’enquête sur la satisfaction autodéclarée des Canadiennes et des Canadiens à l’égard de la vie. L’incidence de ces effets sur les réponses relatives à la satisfaction à l’égard de la vie est mesurée dans le cadre de trois séries d’enquêtes de Statistique Canada : l’Enquête sociale générale, l’Enquête sur la santé dans les collectivités canadiennes et l’Enquête sociale canadienne.
    Date de diffusion : 2023-01-25

  • Articles et rapports : 12-001-X202200200003
    Description :

    Les enquêtes non probabilistes jouent un rôle croissant dans la recherche par enquête. L’étude de Wu rassemble de façon compétente les nombreux outils disponibles lorsqu’on suppose que la non-réponse est conditionnellement indépendante de la variable étudiée. Dans le présent exposé, j’étudie la façon d’intégrer les idées de Wu dans un cadre plus large qui englobe le cas dans lequel la non-réponse dépend de la variable étudiée, un cas qui est particulièrement dangereux dans les sondages non probabilistes.

    Date de diffusion : 2022-12-15

  • Articles et rapports : 12-001-X202200200010
    Description :

    Des modèles de séries chronologiques multiniveaux sont appliqués pour estimer les tendances de séries chronologiques de la couverture des soins prénataux à plusieurs niveaux administratifs du Bangladesh, d’après les cycles répétés de la Bangladesh Demographic and Health Survey (BDHS, Enquête démographique et sur la santé du Bangladesh) pendant la période allant de 1994 à 2014. Les modèles de séries chronologiques multiniveaux sont exprimés dans un cadre bayésien hiérarchique et ajustés au moyen de simulations Monte Carlo par chaînes de Markov. Les modèles tiennent compte des intervalles variables de trois ou quatre ans entre les cycles de la BDHS et fournissent aussi des prédictions pour les années intermédiaires. Il est proposé d’appliquer les modèles transversaux de Fay-Herriot aux années d’enquête séparément au niveau des districts, soit l’échelle régionale la plus détaillée. Les séries chronologiques de ces prédictions pour petits domaines au niveau des districts et leurs matrices de variance-covariance sont utilisées comme séries de données d’entrée pour les modèles de séries chronologiques multiniveaux. Dans ces modèles, on examine les corrélations spatiales entre les districts, la pente et l’ordonnée à l’origine aléatoires au niveau des districts, ainsi que les différents modèles de tendance au niveau des districts et aux niveaux régionaux plus élevés pour l’emprunt d’information dans le temps et l’espace. Les estimations des tendances au niveau des districts sont obtenues directement à partir des résultats des modèles, tandis que les estimations des tendances à des échelons régionaux et nationaux plus élevés sont obtenues par agrégation des prédictions au niveau des districts, ce qui donne un ensemble cohérent d’estimations des tendances sur le plan numérique.

    Date de diffusion : 2022-12-15

  • Articles et rapports : 89-648-X2022001
    Description :

    Le présent rapport examine l'ampleur et la nature des problèmes d'attrition touchant l'Étude longitudinale et internationale des adultes (l'ELIA), et explore l'utilisation d'une stratégie d'ajustement et de calage des poids pour la non-réponse qui pourrait atténuer les effets de l'attrition sur les estimations de l'ELIA. L'étude porte sur les données des vagues 1 (2012) à 4 (2018) et utilise des exemples pratiques fondés sur des variables démographiques choisies pour illustrer la façon dont l'attrition doit être évaluée et traitée.

    Date de diffusion : 2022-11-14

  • Articles et rapports : 12-001-X202200100001
    Description :

    Dans la présente étude, nous tentons d’établir dans quelle mesure l’âge et le niveau de scolarité des répondants peuvent être systématiquement associés à un comportement de réponse indésirable (CRI) dans un ensemble d’enquêtes. À cette fin, nous avons utilisé les données obtenues auprès d’un panel de répondants ayant participé à 10 enquêtes démographiques générales réalisées par CentERdata et le bureau central de la statistique des Pays-Bas. Nous avons utilisé une nouvelle méthode pour présenter visuellement les CRI ainsi qu’une adaptation ingénieuse d’une mesure non paramétrique de l’ampleur de l’effet. Des répartitions de la densité, que nous appelons des profils des répondants, font état de l’occurrence d’un CRI chez des répondants affichant des caractéristiques particulières. Afin de comparer ces profils du point de vue d’une occurrence potentiellement constante d’un CRI dans les enquêtes, nous avons utilisé une adaptation du delta de Cliff, qui décrit efficacement l’ampleur de l’effet. Dans les enquêtes prises globalement, la mesure d’un CRI varie selon l’âge et le niveau de scolarité. Les résultats ne montrent pas un CRI constant dans les enquêtes considérées individuellement : l’âge et le niveau de scolarité sont associés à une occurrence relativement plus élevée dans certaines enquêtes, mais relativement plus faible dans d’autres. Nous en concluons que l’occurrence d’un CRI peut dépendre davantage de l’enquête et de ses éléments que de la capacité cognitive du répondant.

    Date de diffusion : 2022-06-21

  • Articles et rapports : 12-001-X202200100006
    Description :

    Au cours des deux dernières décennies, les taux de réponse aux enquêtes ont régulièrement diminué. Dans ce contexte, il est devenu de plus en plus important pour les organismes statistiques d’élaborer et d’utiliser des méthodes permettant de réduire les effets négatifs de la non-réponse sur l’exactitude des estimations découlant d’enquêtes. Le suivi des cas de non-réponse peut être un remède efficace, même s’il exige du temps et des ressources, pour pallier le biais de non-réponse. Nous avons mené une étude par simulations à l’aide de données réelles d’enquêtes-entreprises, afin de tenter de répondre à plusieurs questions relatives au suivi de la non-réponse. Par exemple, en supposant un budget fixe de suivi de la non-réponse, quelle est la meilleure façon de sélectionner les unités non répondantes auprès desquelles effectuer un suivi ? Quel effort devons-nous consacrer à un suivi répété des non-répondants jusqu’à la réception d’une réponse ? Les non-répondants devraient-ils tous faire l’objet d’un suivi ou seulement un échantillon d’entre eux ? Dans le cas d’un suivi d’un échantillon seulement, comment sélectionner ce dernier ? Nous avons comparé les biais relatifs Monte Carlo et les racines de l’erreur quadratique moyenne relative Monte Carlo pour différents plans de sondage du suivi, tailles d’échantillon et scénarios de non-réponse. Nous avons également déterminé une expression de la taille de l’échantillon de suivi minimale nécessaire pour dépenser le budget, en moyenne, et montré que cela maximise le taux de réponse espéré. Une principale conclusion de notre expérience de simulation est que cette taille d’échantillon semble également réduire approximativement le biais et l’erreur quadratique moyenne des estimations.

    Date de diffusion : 2022-06-21

  • Articles et rapports : 12-001-X202200100008
    Description :

    La méthode d’imputation multiple à classes latentes (IMCL) allie l’imputation multiple à l’analyse de classe latente afin de corriger une classification erronée dans des ensembles de données combinés. De plus, l’IMCL permet de générer un ensemble de données multi-imputé qu’il est possible d’utiliser pour l’estimation directe de différentes statistiques, faisant en sorte que l’incertitude due à une classification erronée soit intégrée au moment d’estimer la variance totale. Dans la présente étude, les auteurs ont examiné la façon dont il est possible d’ajuster la méthode d’IMCL pour l’utiliser à des fins de recensement. Ils ont plus précisément étudié le mode de prise en charge, par la méthode d’IMCL, d’un registre de population fini et complet, la façon dont la méthode permet de corriger simultanément une classification erronée de multiples variables latentes et la façon dont elle permet d’intégrer plusieurs restrictions de vérification. Une étude par simulations montre que la méthode d’IMCL peut habituellement reproduire des fréquences par cellule dans des tableaux à basse et à haute dimensionnalité, comportant de faibles quantités de biais. Il est en outre possible d’estimer adéquatement la variance, même si elle est surestimée lorsque les fréquences par cellule sont moindres.

    Date de diffusion : 2022-06-21
Revues et périodiques (1)

Revues et périodiques (1) ((1 résultat))

  • Revues et périodiques : 85F0036X
    Géographie : Canada
    Description :

    Cette étude porte sur les défis méthodologiques et techniques que présente l'analyse de petits groupes à l'aide d'une enquête par sondage - l'Enquête sociale générale de 1999 sur la victimisation. La discussion porte sur des questions telles que le suréchantillonnage, les taux de réponse, la non-réponse attribuable à la langue, la possibilité de diffusion et la variabilité d'échantillonnage.

    Date de diffusion : 2002-05-14
Date de modification :