Recherche par mot-clé

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Année de publication

10 facets displayed. 0 facets selected.

Contenu

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (20)

Tout (20) (0 à 10 de 20 résultats)

  • Articles et rapports : 12-001-X202200200005
    Description :

    Des hypothèses solides sont nécessaires pour faire des inférences au sujet d’une population finie à partir d’un échantillon non probabiliste. Les statistiques d’un échantillon non probabiliste devraient être accompagnées de preuves que les hypothèses sont respectées et que les estimations ponctuelles et les intervalles de confiance sont propres à l’utilisation. Je décris certains diagnostics qui peuvent être utilisés pour évaluer les hypothèses du modèle, et je discute des questions à prendre en considération au moment de décider s’il convient d’utiliser les données d’un échantillon non probabiliste.

    Date de diffusion : 2022-12-15

  • Enquêtes et programmes statistiques — Documentation : 98-26-0006
    Description :

    Ces lignes directrices fournissent des renseignements qui permettent aux utilisateurs d'utiliser et d'interpréter les indicateurs de la qualité des données du Recensement de 2021 de façon efficace.

    Date de diffusion : 2022-09-21

  • Articles et rapports : 12-001-X202100200008
    Description :

    Les enquêtes à bases de sondage multiples, dans lesquelles des échantillons probabilistes indépendants sont sélectionnés dans chacune des Q bases de sondage, servent depuis longtemps à améliorer la couverture, réduire les coûts ou augmenter la taille des échantillons de sous-populations d’intérêt. Une grande partie de la théorie a été développée en supposant que (1) l’union des bases de sondage couvre la population d’intérêt, (2) un échantillon probabiliste avec réponse complète est sélectionné dans chaque base de sondage, (3) les variables d’intérêt sont mesurées dans chaque échantillon sans erreur de mesure, et (4) il existe suffisamment d’information pour tenir compte du chevauchement des bases de sondage lors du calcul des estimations. Après avoir passé en revue la conception, l’estimation et le calage des enquêtes effectuées à partir de bases de sondage multiples traditionnelles, je considère des modifications aux hypothèses qui permettent à une structure de bases de sondage multiples de servir de principe d’organisation pour d’autres méthodes de combinaison de données telles que l’imputation massive, l’appariement d’échantillons, l’estimation sur petits domaines et l’estimation par techniques de saisie-ressaisie. Enfin, je discute la façon dont les résultats de la recherche sur les enquêtes à l’aide de bases de sondage multiples peuvent être utilisés lors de la conception et de l’évaluation des systèmes de collecte de données qui intègrent plusieurs sources de données.

    Date de diffusion : 2022-01-06

  • 19-22-0004
    Description : L'un des principaux objectifs de la statistique consiste à présenter des données sous forme de renseignements faciles à résumer et à comprendre. L'utilisation d'outils de visualisation des données, comme les graphiques et les tableaux, est un moyen efficace d'atteindre cet objectif. Cette séance d'information vise à montrer des exemples de graphiques et de tableaux courants, à fournir des conseils pratiques pour aider les participants à choisir l'affichage approprié pour leurs données, et à déterminer ce qu'il faut éviter et pour quelle raison. De manière générale, l'objet est de renforcer la capacité statistique et d'améliorer la compréhension des techniques fondamentales qui favorisent la diffusion précise et efficace des statistiques et des résultats de recherche.

    https://www.statcan.gc.ca/fr/afc/information/19220004
    Date de diffusion : 2020-10-30

  • Articles et rapports : 12-001-X201900100002
    Description :

    La non-réponse partielle se produit fréquemment dans les enquêtes-échantillons. On utilise couramment l’imputation hot deck pour remplacer les valeurs des items manquants dans des groupes homogènes appelés classes d’imputation. Nous proposons une procédure d’imputation hot deck fractionnaire et une vraisemblance empirique associée pour l’inférence sur la moyenne de population d’une fonction d’une variable d’intérêt présentant des données manquantes selon un échantillonnage avec probabilité proportionnelle à la taille avec fractions d’échantillonnage négligeables. Nous calculons les distributions limites de l’estimateur du maximum de vraisemblance empirique et du rapport de vraisemblance empirique, et nous proposons deux procédures bootstrap asymptotiques valides afin de construire des intervalles de confiance pour la moyenne de population. Les études par simulations montrent que les procédures bootstrap proposées donnent de meilleurs résultats que les procédures bootstrap habituelles, qui se révèlent asymptotiquement incorrectes quand le nombre de tirages aléatoires de l’imputation fractionnaire est fixe. De plus, la procédure bootstrap proposée, fondée sur le rapport de vraisemblance empirique, semble donner des résultats significativement meilleurs que la méthode fondée sur la distribution limite de l’estimateur du maximum de vraisemblance empirique en cas de grande variation des probabilités d’inclusion ou d’échantillon de petite taille.

    Date de diffusion : 2019-05-07

  • Enquêtes et programmes statistiques — Documentation : 62F0026M2011001
    Description :

    Dans ce rapport, on présente les indicateurs de qualité produits pour l'Enquête sur les dépenses des ménages de 2009. Ces indicateurs de qualité, tels que les coefficients de variation, les taux de non-réponse, les taux de glissement et les taux d'imputation, permettent aux utilisateurs d'interpréter les données.

    Date de diffusion : 2011-06-16

  • Articles et rapports : 62F0026M2005003
    Description :

    L'Enquête sur les dépenses alimentaires (EDA) est une enquête périodique recueillant des informations auprès des ménages sur les habitudes de dépense alimentaire. La collecte des renseignements se fait principalement à partir de journaux hebdomadaires des achats que les répondants doivent remplir quotidiennement durant deux semaines consécutives.

    L'EDA, comme toutes les enquêtes, est sujette aux erreurs et ce malgré toutes les précautions prises aux différentes étapes de l'enquête pour les contrôler. Quoiqu'il n'existe pas de mesure exhaustive de la qualité des données d'une enquête, certaines mesures de qualité produites aux différentes étapes de l'enquête peuvent fournir à l'utilisateur de l'information pertinente pour une bonne interprétation des données.

    Ce document présente, pour l'EDA de 2001, les indicateurs de qualité suivants : les coefficients de variation, les taux de non-réponse, les taux de vacance, les taux de glissement, les taux d'imputation ainsi que les incidences de l'imputation sur les estimations.

    Date de diffusion : 2005-07-08

  • Articles et rapports : 11-522-X20030017708
    Description :

    Cet article donne un aperçu du travail accompli, à ce jour, dans l'utilisation des données de la TPS à Statistique Canada comme remplacement direct au niveau de l'imputation ou de l'estimation ou comme outil de certification des données.

    Date de diffusion : 2005-01-26

  • Articles et rapports : 11-522-X20030017712
    Description :

    Ce document porte sur l'estimation de variance en présence d'imputation ainsi qu'à son application à l'estimation d'indices de prix, à l'échantillonnage à plusieurs degrés et au recours au graphisme dans les publications.

    Date de diffusion : 2005-01-26

  • Enquêtes et programmes statistiques — Documentation : 62F0026M2004001
    Description :

    Dans ce rapport, on présente les indicateurs de qualité produits pour l'Enquête sur les dépenses des ménages de 2002. Ces indicateurs de qualité, tels que les coefficients de variation, les taux de non-réponse, les taux de glissement et les taux d'imputation, permettent aux utilisateurs d'interpréter les données.

    Date de diffusion : 2004-09-15
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (15)

Analyses (15) (0 à 10 de 15 résultats)

  • Articles et rapports : 12-001-X202200200005
    Description :

    Des hypothèses solides sont nécessaires pour faire des inférences au sujet d’une population finie à partir d’un échantillon non probabiliste. Les statistiques d’un échantillon non probabiliste devraient être accompagnées de preuves que les hypothèses sont respectées et que les estimations ponctuelles et les intervalles de confiance sont propres à l’utilisation. Je décris certains diagnostics qui peuvent être utilisés pour évaluer les hypothèses du modèle, et je discute des questions à prendre en considération au moment de décider s’il convient d’utiliser les données d’un échantillon non probabiliste.

    Date de diffusion : 2022-12-15

  • Articles et rapports : 12-001-X202100200008
    Description :

    Les enquêtes à bases de sondage multiples, dans lesquelles des échantillons probabilistes indépendants sont sélectionnés dans chacune des Q bases de sondage, servent depuis longtemps à améliorer la couverture, réduire les coûts ou augmenter la taille des échantillons de sous-populations d’intérêt. Une grande partie de la théorie a été développée en supposant que (1) l’union des bases de sondage couvre la population d’intérêt, (2) un échantillon probabiliste avec réponse complète est sélectionné dans chaque base de sondage, (3) les variables d’intérêt sont mesurées dans chaque échantillon sans erreur de mesure, et (4) il existe suffisamment d’information pour tenir compte du chevauchement des bases de sondage lors du calcul des estimations. Après avoir passé en revue la conception, l’estimation et le calage des enquêtes effectuées à partir de bases de sondage multiples traditionnelles, je considère des modifications aux hypothèses qui permettent à une structure de bases de sondage multiples de servir de principe d’organisation pour d’autres méthodes de combinaison de données telles que l’imputation massive, l’appariement d’échantillons, l’estimation sur petits domaines et l’estimation par techniques de saisie-ressaisie. Enfin, je discute la façon dont les résultats de la recherche sur les enquêtes à l’aide de bases de sondage multiples peuvent être utilisés lors de la conception et de l’évaluation des systèmes de collecte de données qui intègrent plusieurs sources de données.

    Date de diffusion : 2022-01-06

  • Articles et rapports : 12-001-X201900100002
    Description :

    La non-réponse partielle se produit fréquemment dans les enquêtes-échantillons. On utilise couramment l’imputation hot deck pour remplacer les valeurs des items manquants dans des groupes homogènes appelés classes d’imputation. Nous proposons une procédure d’imputation hot deck fractionnaire et une vraisemblance empirique associée pour l’inférence sur la moyenne de population d’une fonction d’une variable d’intérêt présentant des données manquantes selon un échantillonnage avec probabilité proportionnelle à la taille avec fractions d’échantillonnage négligeables. Nous calculons les distributions limites de l’estimateur du maximum de vraisemblance empirique et du rapport de vraisemblance empirique, et nous proposons deux procédures bootstrap asymptotiques valides afin de construire des intervalles de confiance pour la moyenne de population. Les études par simulations montrent que les procédures bootstrap proposées donnent de meilleurs résultats que les procédures bootstrap habituelles, qui se révèlent asymptotiquement incorrectes quand le nombre de tirages aléatoires de l’imputation fractionnaire est fixe. De plus, la procédure bootstrap proposée, fondée sur le rapport de vraisemblance empirique, semble donner des résultats significativement meilleurs que la méthode fondée sur la distribution limite de l’estimateur du maximum de vraisemblance empirique en cas de grande variation des probabilités d’inclusion ou d’échantillon de petite taille.

    Date de diffusion : 2019-05-07

  • Articles et rapports : 62F0026M2005003
    Description :

    L'Enquête sur les dépenses alimentaires (EDA) est une enquête périodique recueillant des informations auprès des ménages sur les habitudes de dépense alimentaire. La collecte des renseignements se fait principalement à partir de journaux hebdomadaires des achats que les répondants doivent remplir quotidiennement durant deux semaines consécutives.

    L'EDA, comme toutes les enquêtes, est sujette aux erreurs et ce malgré toutes les précautions prises aux différentes étapes de l'enquête pour les contrôler. Quoiqu'il n'existe pas de mesure exhaustive de la qualité des données d'une enquête, certaines mesures de qualité produites aux différentes étapes de l'enquête peuvent fournir à l'utilisateur de l'information pertinente pour une bonne interprétation des données.

    Ce document présente, pour l'EDA de 2001, les indicateurs de qualité suivants : les coefficients de variation, les taux de non-réponse, les taux de vacance, les taux de glissement, les taux d'imputation ainsi que les incidences de l'imputation sur les estimations.

    Date de diffusion : 2005-07-08

  • Articles et rapports : 11-522-X20030017708
    Description :

    Cet article donne un aperçu du travail accompli, à ce jour, dans l'utilisation des données de la TPS à Statistique Canada comme remplacement direct au niveau de l'imputation ou de l'estimation ou comme outil de certification des données.

    Date de diffusion : 2005-01-26

  • Articles et rapports : 11-522-X20030017712
    Description :

    Ce document porte sur l'estimation de variance en présence d'imputation ainsi qu'à son application à l'estimation d'indices de prix, à l'échantillonnage à plusieurs degrés et au recours au graphisme dans les publications.

    Date de diffusion : 2005-01-26

  • Articles et rapports : 12-001-X199200214483
    Description :

    Dans presque toutes les grandes enquêtes, l’imputation est utilisée sous une forme ou sous une autre. Le présent article expose une méthode d’estimation de la variance lorsque l’imputation simple (plutôt que multiple) est utilisée pour créer un ensemble complet de données. L’imputation ne reproduit jamais les vraies valeurs (sauf dans des cas tout à fait exceptionnels). L’erreur totale de l’estimation de l’enquête est considérée, dans cet article, comme la somme de l’erreur d’échantillonnage et de l’erreur d’imputation. Par conséquent, on en arrive à une variance globale qui est la somme d’une variance d’échantillonnage et d’une variance d’imputation. L’article s’attarde principalement à l’estimation de ces deux composantes, en utilisant les données après imputation, c’est-à-dire les valeurs réellement observées et les valeurs imputées. La méthode est fondée sur un modèle, en ce sens que le modèle sous-jacent à la méthode d’imputation, ainsi que la distribution de randomisation ayant servi à la sélection de l’échantillon, détermineront ensemble la forme que prendront les estimateurs de la variance. Les résultats théoriques sont confirmés par une simulation de Monte Carlo.

    Date de diffusion : 1992-12-15

  • Articles et rapports : 12-001-X198800114598
    Description :

    Cet article porte sur les méthodes de traitement des données manquantes dans les enquêtes postcensitaires en vue de l’estimation de l’erreur de couverture dans le recensement; à titre d’illustration, nous analysons le test des opérations de redressement de 1986 (Diffendal 1988). Les méthodes précitées comprennent des méthodes d’imputation fondées sur le hot-deck et des modèles de régression logistique de même que des méthodes de redressement par la pondération. Nous analysons également la sensibilité des estimations de sous-dénombrement tirées du test de 1986 à la variation des modèles d’imputation.

    Date de diffusion : 1988-06-15

  • Articles et rapports : 12-001-X198600214449
    Description :

    Presque tous les recensements et enquêtes comportent deux types de non-réponses : la non-réponse au questionnaire (non-réponse totale) et la non-réponse à une question (non-réponse partielle). Plusieurs méthodes de compensation de la non-réponse ont été élaborées pour tenter de réduire la distorsion due à la non-réponse. Cet article résume les méthodes de compensation de la non-réponse utilisées au U.S. Census Bureau, et traite particulièrement du problème de la non-réponse au questionnaire. On examine aussi sommairement les travaux de recherche actuels et futurs dans ce domaine.

    Date de diffusion : 1986-12-15

  • Articles et rapports : 12-001-X198600114404
    Description :

    La non-réponse intégrale et la non-réponse à une question sont les causes des données d’enquête manquantes. On corrige habituellement la non-réponse intégrale par une certaine correction des pondérations, tandis que la non-réponse à une question est corrigée par une sorte d’imputation. Les auteurs examinent les méthodes de correction par pondération et imputation ainsi que leurs propriétés.

    Date de diffusion : 1986-06-16
Références (4)

Références (4) ((4 résultats))

  • Enquêtes et programmes statistiques — Documentation : 98-26-0006
    Description :

    Ces lignes directrices fournissent des renseignements qui permettent aux utilisateurs d'utiliser et d'interpréter les indicateurs de la qualité des données du Recensement de 2021 de façon efficace.

    Date de diffusion : 2022-09-21

  • Enquêtes et programmes statistiques — Documentation : 62F0026M2011001
    Description :

    Dans ce rapport, on présente les indicateurs de qualité produits pour l'Enquête sur les dépenses des ménages de 2009. Ces indicateurs de qualité, tels que les coefficients de variation, les taux de non-réponse, les taux de glissement et les taux d'imputation, permettent aux utilisateurs d'interpréter les données.

    Date de diffusion : 2011-06-16

  • Enquêtes et programmes statistiques — Documentation : 62F0026M2004001
    Description :

    Dans ce rapport, on présente les indicateurs de qualité produits pour l'Enquête sur les dépenses des ménages de 2002. Ces indicateurs de qualité, tels que les coefficients de variation, les taux de non-réponse, les taux de glissement et les taux d'imputation, permettent aux utilisateurs d'interpréter les données.

    Date de diffusion : 2004-09-15

  • Enquêtes et programmes statistiques — Documentation : 92-391-X
    Description :

    Ce rapport renferme des renseignements de base sur les concepts et la qualité des données visant à faciliter l'utilisation et l'interprétation des données du recensement sur l'industrie. Il donne un aperçu du cycle de traitement des données, qui comprend notamment le dépouillement régional, le contrôle et l'imputation ainsi que le calcul des taux d'erreur. Une description détaillée des systèmes de codage automatisé utilisés au recensement de 2001, ainsi que des changements importants apportés aux méthodes d'imputation, est également fournie. Enfin, ce rapport contient des tableaux sommaires faisant état de la qualité des données du recensement de 2001 portant sur l'industrie. Les annexes renferment des données chronologiques remontant au recensement de 1971.

    Date de diffusion : 2004-06-02
Date de modification :