Recherche par mot-clé

Aller au contenu principal
Aller au pied de page

Sélection de la langue

English

Recherche et menus

Recherche et menus

Rechercher

Résultats

Tout (20)

Tout (20) (0 à 10 de 20 résultats)

1. Commentaires de Sharon L. Lohr à propos de l’article « Inférence statistique avec des échantillons d’enquête non probabiliste »
Articles et rapports : 12-001-X202200200005
Description :
Des hypothèses solides sont nécessaires pour faire des inférences au sujet d’une population finie à partir d’un échantillon non probabiliste. Les statistiques d’un échantillon non probabiliste devraient être accompagnées de preuves que les hypothèses sont respectées et que les estimations ponctuelles et les intervalles de confiance sont propres à l’utilisation. Je décris certains diagnostics qui peuvent être utilisés pour évaluer les hypothèses du modèle, et je discute des questions à prendre en considération au moment de décider s’il convient d’utiliser les données d’un échantillon non probabiliste.

Date de diffusion : 2022-12-15
2. Lignes directrices sur la qualité des données du Recensement de 2021
Enquêtes et programmes statistiques — Documentation : 98-26-0006
Description :
Ces lignes directrices fournissent des renseignements qui permettent aux utilisateurs d'utiliser et d'interpréter les indicateurs de la qualité des données du Recensement de 2021 de façon efficace.

Date de diffusion : 2022-09-21
3. Les enquêtes à bases de sondage multiples pour un monde fait de sources de données multiples
Articles et rapports : 12-001-X202100200008
Description :
Les enquêtes à bases de sondage multiples, dans lesquelles des échantillons probabilistes indépendants sont sélectionnés dans chacune des Q bases de sondage, servent depuis longtemps à améliorer la couverture, réduire les coûts ou augmenter la taille des échantillons de sous-populations d’intérêt. Une grande partie de la théorie a été développée en supposant que (1) l’union des bases de sondage couvre la population d’intérêt, (2) un échantillon probabiliste avec réponse complète est sélectionné dans chaque base de sondage, (3) les variables d’intérêt sont mesurées dans chaque échantillon sans erreur de mesure, et (4) il existe suffisamment d’information pour tenir compte du chevauchement des bases de sondage lors du calcul des estimations. Après avoir passé en revue la conception, l’estimation et le calage des enquêtes effectuées à partir de bases de sondage multiples traditionnelles, je considère des modifications aux hypothèses qui permettent à une structure de bases de sondage multiples de servir de principe d’organisation pour d’autres méthodes de combinaison de données telles que l’imputation massive, l’appariement d’échantillons, l’estimation sur petits domaines et l’estimation par techniques de saisie-ressaisie. Enfin, je discute la façon dont les résultats de la recherche sur les enquêtes à l’aide de bases de sondage multiples peuvent être utilisés lors de la conception et de l’évaluation des systèmes de collecte de données qui intègrent plusieurs sources de données.
Date de diffusion : 2022-01-06
4. Considérations concernant l’affichage de données à l’aide de graphiques
19-22-0004
Description : L'un des principaux objectifs de la statistique consiste à présenter des données sous forme de renseignements faciles à résumer et à comprendre. L'utilisation d'outils de visualisation des données, comme les graphiques et les tableaux, est un moyen efficace d'atteindre cet objectif. Cette séance d'information vise à montrer des exemples de graphiques et de tableaux courants, à fournir des conseils pratiques pour aider les participants à choisir l'affichage approprié pour leurs données, et à déterminer ce qu'il faut éviter et pour quelle raison. De manière générale, l'objet est de renforcer la capacité statistique et d'améliorer la compréhension des techniques fondamentales qui favorisent la diffusion précise et efficace des statistiques et des résultats de recherche.
https://www.statcan.gc.ca/fr/afc/information/19220004
Date de diffusion : 2020-10-30
5. Inférence fondée sur la vraisemblance empirique pour les données d’enquête manquantes selon un échantillonnage à probabilités inégales Archivé
Articles et rapports : 12-001-X201900100002
Description :
La non-réponse partielle se produit fréquemment dans les enquêtes-échantillons. On utilise couramment l’imputation hot deck pour remplacer les valeurs des items manquants dans des groupes homogènes appelés classes d’imputation. Nous proposons une procédure d’imputation hot deck fractionnaire et une vraisemblance empirique associée pour l’inférence sur la moyenne de population d’une fonction d’une variable d’intérêt présentant des données manquantes selon un échantillonnage avec probabilité proportionnelle à la taille avec fractions d’échantillonnage négligeables. Nous calculons les distributions limites de l’estimateur du maximum de vraisemblance empirique et du rapport de vraisemblance empirique, et nous proposons deux procédures bootstrap asymptotiques valides afin de construire des intervalles de confiance pour la moyenne de population. Les études par simulations montrent que les procédures bootstrap proposées donnent de meilleurs résultats que les procédures bootstrap habituelles, qui se révèlent asymptotiquement incorrectes quand le nombre de tirages aléatoires de l’imputation fractionnaire est fixe. De plus, la procédure bootstrap proposée, fondée sur le rapport de vraisemblance empirique, semble donner des résultats significativement meilleurs que la méthode fondée sur la distribution limite de l’estimateur du maximum de vraisemblance empirique en cas de grande variation des probabilités d’inclusion ou d’échantillon de petite taille.
Date de diffusion : 2019-05-07
6. Enquête sur les dépenses des ménages de 2009 : indicateurs de qualité des données Archivé
Enquêtes et programmes statistiques — Documentation : 62F0026M2011001
Description :
Dans ce rapport, on présente les indicateurs de qualité produits pour l'Enquête sur les dépenses des ménages de 2009. Ces indicateurs de qualité, tels que les coefficients de variation, les taux de non-réponse, les taux de glissement et les taux d'imputation, permettent aux utilisateurs d'interpréter les données.
Date de diffusion : 2011-06-16
7. Enquête sur les dépenses alimentaires de 2001 : indicateurs de qualité des données Archivé
Articles et rapports : 62F0026M2005003
Description :
L'Enquête sur les dépenses alimentaires (EDA) est une enquête périodique recueillant des informations auprès des ménages sur les habitudes de dépense alimentaire. La collecte des renseignements se fait principalement à partir de journaux hebdomadaires des achats que les répondants doivent remplir quotidiennement durant deux semaines consécutives.
L'EDA, comme toutes les enquêtes, est sujette aux erreurs et ce malgré toutes les précautions prises aux différentes étapes de l'enquête pour les contrôler. Quoiqu'il n'existe pas de mesure exhaustive de la qualité des données d'une enquête, certaines mesures de qualité produites aux différentes étapes de l'enquête peuvent fournir à l'utilisateur de l'information pertinente pour une bonne interprétation des données.
Ce document présente, pour l'EDA de 2001, les indicateurs de qualité suivants : les coefficients de variation, les taux de non-réponse, les taux de vacance, les taux de glissement, les taux d'imputation ainsi que les incidences de l'imputation sur les estimations.
Date de diffusion : 2005-07-08
8. Utilisation des données fiscales : une application des données de la taxe sur les produits et services (TPS) Archivé
Articles et rapports : 11-522-X20030017708
Description :
Cet article donne un aperçu du travail accompli, à ce jour, dans l'utilisation des données de la TPS à Statistique Canada comme remplacement direct au niveau de l'imputation ou de l'estimation ou comme outil de certification des données.
Date de diffusion : 2005-01-26
9. Application de nouvelles techniques statistiques Archivé
Articles et rapports : 11-522-X20030017712
Description :
Ce document porte sur l'estimation de variance en présence d'imputation ainsi qu'à son application à l'estimation d'indices de prix, à l'échantillonnage à plusieurs degrés et au recours au graphisme dans les publications.
Date de diffusion : 2005-01-26
10. Enquête sur les dépenses des ménages de 2002 : indicateurs de qualité des données Archivé
Enquêtes et programmes statistiques — Documentation : 62F0026M2004001
Description :
Dans ce rapport, on présente les indicateurs de qualité produits pour l'Enquête sur les dépenses des ménages de 2002. Ces indicateurs de qualité, tels que les coefficients de variation, les taux de non-réponse, les taux de glissement et les taux d'imputation, permettent aux utilisateurs d'interpréter les données.
Date de diffusion : 2004-09-15

Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (15)

Analyses (15) (0 à 10 de 15 résultats)

1. Commentaires de Sharon L. Lohr à propos de l’article « Inférence statistique avec des échantillons d’enquête non probabiliste »
Articles et rapports : 12-001-X202200200005
Description :
Des hypothèses solides sont nécessaires pour faire des inférences au sujet d’une population finie à partir d’un échantillon non probabiliste. Les statistiques d’un échantillon non probabiliste devraient être accompagnées de preuves que les hypothèses sont respectées et que les estimations ponctuelles et les intervalles de confiance sont propres à l’utilisation. Je décris certains diagnostics qui peuvent être utilisés pour évaluer les hypothèses du modèle, et je discute des questions à prendre en considération au moment de décider s’il convient d’utiliser les données d’un échantillon non probabiliste.

Date de diffusion : 2022-12-15
2. Les enquêtes à bases de sondage multiples pour un monde fait de sources de données multiples
Articles et rapports : 12-001-X202100200008
Description :
Les enquêtes à bases de sondage multiples, dans lesquelles des échantillons probabilistes indépendants sont sélectionnés dans chacune des Q bases de sondage, servent depuis longtemps à améliorer la couverture, réduire les coûts ou augmenter la taille des échantillons de sous-populations d’intérêt. Une grande partie de la théorie a été développée en supposant que (1) l’union des bases de sondage couvre la population d’intérêt, (2) un échantillon probabiliste avec réponse complète est sélectionné dans chaque base de sondage, (3) les variables d’intérêt sont mesurées dans chaque échantillon sans erreur de mesure, et (4) il existe suffisamment d’information pour tenir compte du chevauchement des bases de sondage lors du calcul des estimations. Après avoir passé en revue la conception, l’estimation et le calage des enquêtes effectuées à partir de bases de sondage multiples traditionnelles, je considère des modifications aux hypothèses qui permettent à une structure de bases de sondage multiples de servir de principe d’organisation pour d’autres méthodes de combinaison de données telles que l’imputation massive, l’appariement d’échantillons, l’estimation sur petits domaines et l’estimation par techniques de saisie-ressaisie. Enfin, je discute la façon dont les résultats de la recherche sur les enquêtes à l’aide de bases de sondage multiples peuvent être utilisés lors de la conception et de l’évaluation des systèmes de collecte de données qui intègrent plusieurs sources de données.
Date de diffusion : 2022-01-06
3. Inférence fondée sur la vraisemblance empirique pour les données d’enquête manquantes selon un échantillonnage à probabilités inégales Archivé
Articles et rapports : 12-001-X201900100002
Description :
La non-réponse partielle se produit fréquemment dans les enquêtes-échantillons. On utilise couramment l’imputation hot deck pour remplacer les valeurs des items manquants dans des groupes homogènes appelés classes d’imputation. Nous proposons une procédure d’imputation hot deck fractionnaire et une vraisemblance empirique associée pour l’inférence sur la moyenne de population d’une fonction d’une variable d’intérêt présentant des données manquantes selon un échantillonnage avec probabilité proportionnelle à la taille avec fractions d’échantillonnage négligeables. Nous calculons les distributions limites de l’estimateur du maximum de vraisemblance empirique et du rapport de vraisemblance empirique, et nous proposons deux procédures bootstrap asymptotiques valides afin de construire des intervalles de confiance pour la moyenne de population. Les études par simulations montrent que les procédures bootstrap proposées donnent de meilleurs résultats que les procédures bootstrap habituelles, qui se révèlent asymptotiquement incorrectes quand le nombre de tirages aléatoires de l’imputation fractionnaire est fixe. De plus, la procédure bootstrap proposée, fondée sur le rapport de vraisemblance empirique, semble donner des résultats significativement meilleurs que la méthode fondée sur la distribution limite de l’estimateur du maximum de vraisemblance empirique en cas de grande variation des probabilités d’inclusion ou d’échantillon de petite taille.
Date de diffusion : 2019-05-07
4. Enquête sur les dépenses alimentaires de 2001 : indicateurs de qualité des données Archivé
Articles et rapports : 62F0026M2005003
Description :
L'Enquête sur les dépenses alimentaires (EDA) est une enquête périodique recueillant des informations auprès des ménages sur les habitudes de dépense alimentaire. La collecte des renseignements se fait principalement à partir de journaux hebdomadaires des achats que les répondants doivent remplir quotidiennement durant deux semaines consécutives.
L'EDA, comme toutes les enquêtes, est sujette aux erreurs et ce malgré toutes les précautions prises aux différentes étapes de l'enquête pour les contrôler. Quoiqu'il n'existe pas de mesure exhaustive de la qualité des données d'une enquête, certaines mesures de qualité produites aux différentes étapes de l'enquête peuvent fournir à l'utilisateur de l'information pertinente pour une bonne interprétation des données.
Ce document présente, pour l'EDA de 2001, les indicateurs de qualité suivants : les coefficients de variation, les taux de non-réponse, les taux de vacance, les taux de glissement, les taux d'imputation ainsi que les incidences de l'imputation sur les estimations.
Date de diffusion : 2005-07-08
5. Utilisation des données fiscales : une application des données de la taxe sur les produits et services (TPS) Archivé
Articles et rapports : 11-522-X20030017708
Description :
Cet article donne un aperçu du travail accompli, à ce jour, dans l'utilisation des données de la TPS à Statistique Canada comme remplacement direct au niveau de l'imputation ou de l'estimation ou comme outil de certification des données.
Date de diffusion : 2005-01-26
6. Application de nouvelles techniques statistiques Archivé
Articles et rapports : 11-522-X20030017712
Description :
Ce document porte sur l'estimation de variance en présence d'imputation ainsi qu'à son application à l'estimation d'indices de prix, à l'échantillonnage à plusieurs degrés et au recours au graphisme dans les publications.
Date de diffusion : 2005-01-26
7. Méthodes pour estimer la précision des estimations d’une enquête ayant fait l’objet d’une imputation Archivé
Articles et rapports : 12-001-X199200214483
Description :
Dans presque toutes les grandes enquêtes, l’imputation est utilisée sous une forme ou sous une autre. Le présent article expose une méthode d’estimation de la variance lorsque l’imputation simple (plutôt que multiple) est utilisée pour créer un ensemble complet de données. L’imputation ne reproduit jamais les vraies valeurs (sauf dans des cas tout à fait exceptionnels). L’erreur totale de l’estimation de l’enquête est considérée, dans cet article, comme la somme de l’erreur d’échantillonnage et de l’erreur d’imputation. Par conséquent, on en arrive à une variance globale qui est la somme d’une variance d’échantillonnage et d’une variance d’imputation. L’article s’attarde principalement à l’estimation de ces deux composantes, en utilisant les données après imputation, c’est-à-dire les valeurs réellement observées et les valeurs imputées. La méthode est fondée sur un modèle, en ce sens que le modèle sous-jacent à la méthode d’imputation, ainsi que la distribution de randomisation ayant servi à la sélection de l’échantillon, détermineront ensemble la forme que prendront les estimateurs de la variance. Les résultats théoriques sont confirmés par une simulation de Monte Carlo.
Date de diffusion : 1992-12-15
8. Traitement des données manquantes dans l’estimation de la couverture : le test des opérations de redressement de 1986 Archivé
Articles et rapports : 12-001-X198800114598
Description :
Cet article porte sur les méthodes de traitement des données manquantes dans les enquêtes postcensitaires en vue de l’estimation de l’erreur de couverture dans le recensement; à titre d’illustration, nous analysons le test des opérations de redressement de 1986 (Diffendal 1988). Les méthodes précitées comprennent des méthodes d’imputation fondées sur le hot-deck et des modèles de régression logistique de même que des méthodes de redressement par la pondération. Nous analysons également la sensibilité des estimations de sous-dénombrement tirées du test de 1986 à la variation des modèles d’imputation.
Date de diffusion : 1988-06-15
9. Méthodes de compensation de la non-réponse au U.S. Bureau of the Census Archivé
Articles et rapports : 12-001-X198600214449
Description :
Presque tous les recensements et enquêtes comportent deux types de non-réponses : la non-réponse au questionnaire (non-réponse totale) et la non-réponse à une question (non-réponse partielle). Plusieurs méthodes de compensation de la non-réponse ont été élaborées pour tenter de réduire la distorsion due à la non-réponse. Cet article résume les méthodes de compensation de la non-réponse utilisées au U.S. Census Bureau, et traite particulièrement du problème de la non-réponse au questionnaire. On examine aussi sommairement les travaux de recherche actuels et futurs dans ce domaine.
Date de diffusion : 1986-12-15
10. Le traitement des données d’enquête manquantes Archivé
Articles et rapports : 12-001-X198600114404
Description :
La non-réponse intégrale et la non-réponse à une question sont les causes des données d’enquête manquantes. On corrige habituellement la non-réponse intégrale par une certaine correction des pondérations, tandis que la non-réponse à une question est corrigée par une sorte d’imputation. Les auteurs examinent les méthodes de correction par pondération et imputation ainsi que leurs propriétés.
Date de diffusion : 1986-06-16

Références (4)

Références (4) ((4 résultats))

1. Lignes directrices sur la qualité des données du Recensement de 2021
Enquêtes et programmes statistiques — Documentation : 98-26-0006
Description :
Ces lignes directrices fournissent des renseignements qui permettent aux utilisateurs d'utiliser et d'interpréter les indicateurs de la qualité des données du Recensement de 2021 de façon efficace.

Date de diffusion : 2022-09-21
2. Enquête sur les dépenses des ménages de 2009 : indicateurs de qualité des données Archivé
Enquêtes et programmes statistiques — Documentation : 62F0026M2011001
Description :
Dans ce rapport, on présente les indicateurs de qualité produits pour l'Enquête sur les dépenses des ménages de 2009. Ces indicateurs de qualité, tels que les coefficients de variation, les taux de non-réponse, les taux de glissement et les taux d'imputation, permettent aux utilisateurs d'interpréter les données.
Date de diffusion : 2011-06-16
3. Enquête sur les dépenses des ménages de 2002 : indicateurs de qualité des données Archivé
Enquêtes et programmes statistiques — Documentation : 62F0026M2004001
Description :
Dans ce rapport, on présente les indicateurs de qualité produits pour l'Enquête sur les dépenses des ménages de 2002. Ces indicateurs de qualité, tels que les coefficients de variation, les taux de non-réponse, les taux de glissement et les taux d'imputation, permettent aux utilisateurs d'interpréter les données.
Date de diffusion : 2004-09-15
4. Industrie (selon la Classification type des industries [CTI] de 1980) : rapport technique du Recensement de 2001 (produits de référence, Recensement de 2001) Archivé
Enquêtes et programmes statistiques — Documentation : 92-391-X
Description :
Ce rapport renferme des renseignements de base sur les concepts et la qualité des données visant à faciliter l'utilisation et l'interprétation des données du recensement sur l'industrie. Il donne un aperçu du cycle de traitement des données, qui comprend notamment le dépouillement régional, le contrôle et l'imputation ainsi que le calcul des taux d'erreur. Une description détaillée des systèmes de codage automatisé utilisés au recensement de 2001, ainsi que des changements importants apportés aux méthodes d'imputation, est également fournie. Enfin, ce rapport contient des tableaux sommaires faisant état de la qualité des données du recensement de 2001 portant sur l'industrie. Les annexes renferment des données chronologiques remontant au recensement de 1971.
Date de diffusion : 2004-06-02

Signaler un problème ou une erreur sur cette page

Date de modification :: 2024-07-27

Comment utiliser les filtres et le champ de recherche

Vous pouvez faire une recherche en inscrivant des mots-clés ou en sélectionnant des filtres (p. ex. sous Sujet, Géographie, etc.) du côté gauche de la page.
On peut utiliser les filtres ensemble ou former diverses combinaisons. À chaque sélection de filtre, la page des résultats est mise à jour.
Pour commencer une nouvelle recherche, cliquez sur le bouton Effacer tout au-dessus du champ de recherche ou décochez tous les filtres.
Les mots-clés et les filtres précisés sont affichés au-dessus du champ de recherche. Vous pouvez désélectionner l’un ou l’autre des éléments ou tous les éléments, pour préciser ou effacer votre recherche.

Comment préciser ma recherche

Vous pouvez entrer des mots-clés dans le champ de recherche. Il n’est pas nécessaire d’utiliser « + » ou « , » ou « ET ».
Vous pouvez supprimer certains mots-clés ou tous les mots-clés de votre chaîne de recherche.
Les mots-clés entre guillemets limitent la recherche à l’expression précise.
- Par exemple, si vous cherchez « Enquête sur la population active », vous obtiendrez seulement des documents contenant cette suite de mots.
Utilisez « ou » entre les mots-clés pour obtenir des résultats qui contiennent au moins l’un des termes recherchés.
- Par exemple, si vous cherchez enquête ou population ou active, vous obtiendrez seulement les documents contenant l’un ou l’autre de ces mots, ou tous ces mots.

Comment fonctionne la recherche

Cette forme de recherche fournira les résultats contenant le(s) mot(s) inscrit(s) dans le titre, la description, le sujet, la géographie, le numéro de produit ou toute autre information au sujet du produit.
- Par exemple, lorsque vous cherchez le mot « maladies », tous les résultats obtenus contiendront ce mot dans le titre, la description, ou le sujet.
La recherche ne se fait pas dans le texte des articles ou des publications. Pour faire une recherche plein texte dans les articles, utilisez la fonction de recherche du site.