Contrôle de la divulgation et diffusion de données
Filtrer les résultats par
Search HelpMot(s)-clé(s)
Type
Enquête ou programme statistique
Résultats
Tout (87)
Tout (87) (0 to 10 of 87 results)
- Articles et rapports : 11-522-X202500100001Description : Les différents secteurs utilisent de plus en plus la génération de données synthétiques (GDS) pour partager et augmenter des données tout en protégeant la vie privée ainsi que pour en éliminer les biais. Chaque fois qu'on utilise cet outil, on doit avoir recours à un ensemble distinct de mesures d'évaluation pour tenir compte de la stochasticité du processus de GDS : la vulnérabilité liée à la divulgation des membres et des attributs est essentielle pour protéger la vie privée; la fidélité et l'utilité des tâches en aval s'appliquent de manière plus générale; l'équité et la diversité sont des facteurs pertinents pour éliminer les biais et augmenter les données, respectivement. En présentant les données probantes accumulées et en examinant des études de cas modèles, il est montré que la GDS peut offrir un bon rendement dans bon nombre de ces cas d'utilisation. Dans le présent document les principaux enseignements tirés des expériences en matière de données synthétiques sur la santé sont également partagées.Date de diffusion : 2025-09-08
- 2. Analyse automatisée des documents pour le Compte des flux physiques des matières plastiques ArchivéArticles et rapports : 11-522-X202500100005Description : Le Compte des flux physiques des matières plastiques (CFPMP) vise à améliorer l'analyse environnementale et économique en suivant les flux des matières plastiques dans l'économie canadienne. Afin de rationaliser ce processus complexe, le projet a tiré parti des techniques avancées de traitement du langage naturel (TLN), dont les grands modèles de langage (GML), pour automatiser la classification sectorielle et la synthèse des répercussions de la pandémie de COVID-19 à partir des rapports d'entreprises. L'intégration de modèles d'apprentissage automatique et de méthodes de génération augmentée d'information contextuelle (GAIC) a permis de réduire considérablement la charge de travail manuel, d'améliorer l'efficacité de l'analyse des données et d'obtenir des aperçus de meilleure qualité.Date de diffusion : 2025-09-08
- Articles et rapports : 11-522-X202500100015Description : À l'heure actuelle, Statistique Canada n'a pas de directives officielles sur les règles de confidentialité pour la diffusion d'estimations sur petits domaines. Au cours des dernières années, il y a eu une demande croissante de la part des chercheurs des centres de données de recherche (CDR) pour l'élaboration de lignes directrices complètes en matière de confidentialité afin qu'ils puissent publier des estimations sur petits domaines dans leurs recherches. La présente analyse de confidentialité s'applique à l'estimation sur petits domaines au niveau de la région.Date de diffusion : 2025-09-08
- Articles et rapports : 11-522-X202500100016Description : L'adoption de la production de données synthétiques comme mesure de confidentialité augmente dans les organismes statistiques du monde entier, y compris à Statistique Canada. Cette approche offre une solution de rechange à la diffusion classique de fichiers publics anonymisés de microdonnées, répondant ainsi aux préoccupations en matière de protection de la vie privée et d'utilité des données. La création de données synthétiques présente toutefois des défis au niveau de l'évaluation et de l'atténuation du risque de divulgation. Le présent article passe en revue les différents types de risques de divulgation, soit la divulgation d'attribut, la divulgation de données d'adhésion et la divulgation de l'identité, et présente certaines des méthodes connexes pour mesurer le risque. L'article présente les grandes mesures d'évaluation des risques et examine les méthodes pratiques de contrôle de la divulgation dans le cadre de la synthèse des données. Les méthodes d'évaluation des risques de divulgation produisent habituellement une mesure qui peut servir à jauger le risque, mais il y a peu de consensus sur les valeurs limites de ces mesures. Il importe également de souligner l'importance de trouver le juste équilibre entre l'utilité et la confidentialité, ce qui nécessite une discussion plus approfondie dans le contexte de ces méthodes. L'article se termine en offrant des idées et des recommandations sur la gestion du risque de divulgation lors de la création de données synthétiques. Il offre également quelques perspectives sur les orientations futures de la recherche et les répercussions pratiques de la gestion des risques de divulgation par l'entremise des données synthétiques.Date de diffusion : 2025-09-08
- Articles et rapports : 11-522-X202500100017Description : Les services publics ont des renseignements essentiels sur la consommation d'énergie et les caractéristiques des bâtiments, des renseignements que les organismes gouvernementaux peuvent utiliser pour améliorer leurs analyses correspondantes. Ces données, de nature confidentielle, sont toutefois associées aux enregistrements de clients. Les données sur les bâtiments et la consommation d'énergie peuvent être trop délicates pour être partagées. Souvent, les versions agrégées de ces données sont échangées en vertu de contrats très restrictifs, ce qui limite le nombre de statistiques qui peuvent en être extraites. Avec l'avancement des techniques génératives d'apprentissage automatique, Statistique Canada et Ressources naturelles Canada ont évalué s'il était possible d'utiliser ces modèles pour produire des versions synthétiques des données sur les services publics qui peuvent être échangées intégralement avec les organismes qui en font la demande. Un service public peut créer ces ensembles de données synthétiques dans le cadre d'un programme exécuté localement. Les extrants peuvent être approuvés avant d'être envoyés. Ces travaux ont permis d'établir que les services publics peuvent utiliser certains modèles génératifs pour produire de nouvelles versions d'un ensemble de données, ainsi que de recenser les problèmes qui doivent être résolus avant de mettre en œuvre le tout en pratique. Des modèles tabulaires et de séries temporelles ont été mis à l'essai pour différents scénarios d'échange de données. Le modèle TimeGAN a permis de saisir les pics et les creux de consommation d'énergie au cours d'une journée donnée en respectant des exigences de calcul raisonnables. Bien que ce processus prenne plusieurs jours avant que les quantités d'énergie annuelles totalisent des milliers d'enregistrements de clients, de nouvelles initiatives d'échange de données peuvent être mises en œuvre entre les services publics et les organismes nationaux de statistique, tout en gérant les risques liés à la protection des renseignements personnels. Au fur et à mesure que les travaux avanceront dans le cadre des futures phases qui se dérouleront auprès de vrais partenaires des services publics, la confiance envers ces approches peut se renforcer. On pourra commencer à mettre à l'essai celles-ci en utilisant des données réelles fournies par de réels détenteurs de données.Date de diffusion : 2025-09-08
- Articles et rapports : 11-522-X202500100026Description : En 2022, le Canada est devenu le premier pays à diffuser des informations statistiques sur ses populations transgenre et non binaire selon les données de son recensement. De plus, à la suite d'une directive gouvernementale pancanadienne émise en 2018, les enquêtes de Statistique Canada collectent et diffusent par défaut des informations sur le genre plutôt que le sexe à la naissance. En raison de la taille des populations transgenre et non binaire, la diffusion sécuritaire d'informations statistiques à des niveaux géographiques détaillés présente un défi.Date de diffusion : 2025-09-08
- Articles et rapports : 12-001-X202400200008Description : Lorsqu’ils souhaitent diffuser des fichiers à grande diffusion pour des données confidentielles, les organismes de statistique peuvent générer des données entièrement synthétiques. Nous proposons une méthode pour construire des données entièrement synthétiques à partir d’enquêtes dont les données sont recueillies selon des plans d’échantillonnage complexes. Notre méthode respecte la stratégie générale proposée par Rubin (1993). Plus précisément, nous générons des pseudo-populations en appliquant la méthode du bootstrap bayésien en population finie pondéré pour tenir compte des poids d’enquête, tirons des échantillons aléatoires simples de ces pseudo-populations, estimons des modèles de synthèse en utilisant ces échantillons aléatoires simples et diffusons des données simulées tirées des modèles sous la forme de fichiers à grande diffusion. Pour faciliter l’estimation de la variance, nous utilisons le cadre d’imputation multiple et deux stratégies de génération de données. Dans la première, nous générons plusieurs ensembles de données à partir de chaque échantillon aléatoire simple. Dans la seconde, nous générons un seul ensemble de données synthétiques à partir de chaque échantillon aléatoire simple. Nous présentons des règles de combinaison de l’imputation multiple pour chaque scénario. Nous illustrons les propriétés d’échantillonnage répété des règles de combinaison au moyen d’études par simulations, ce qui comprend des comparaisons avec la génération de données synthétiques en fonction de méthodes de pseudo-vraisemblance. Nous appliquons les méthodes proposées à un sous-ensemble de données tirées de l’American Community Survey.Date de diffusion : 2024-12-20
- Articles et rapports : 11-633-X2024002Description : L’éthique des données est une branche de l’éthique qui soulève les enjeux relatifs à l’utilisation appropriée des données tout au long de leur cycle de vie et qui identifie les pratiques et les actions permissibles dans ce domaine. Cette discipline est mise en œuvre par le Secrétariat à l’éthique des données (SED) de Statistique Canada au moyen d’examens éthiques. Le processus d’examen éthique est une conséquence directe de l’adoption du Cadre de nécessité et de proportionnalité . L’objectif du présent document est de décrire les fondements et l’objectif de ces examens. Cela peut aider les Canadiennes et les Canadiens à mieux comprendre le travail du SED et la façon dont Statistique Canada justifie ces acquisitions de données.Date de diffusion : 2024-12-20
- Enquêtes et programmes statistiques — Documentation : 11-633-X2024004Description : La base de données longitudinales sur l’immigration (BDIM) est une source importante et complète de données contribuant à mieux comprendre le comportement économique des immigrants. Il s’agit du seul ensemble annuel de données canadiennes permettant d’étudier les caractéristiques des immigrants au Canada au moment de leur admission ainsi que leur situation économique et leur mobilité régionale (interprovinciale) sur plus de 35 ans.Date de diffusion : 2024-12-09
- Articles et rapports : 11-522-X202200100007Description : Dans le contexte de la disponibilité de sources de données plus vastes et plus diverses, les instituts statistiques en Europe sont enclins à publier des statistiques sur des groupes plus petits qu’auparavant. En outre, des épisodes mondiaux à forte incidence, comme la crise de la COVID-19 et la situation en Ukraine, peuvent également nécessiter des statistiques sur des sous-groupes particuliers de personnes. La publication de données concernant de petits groupes ciblés soulève non seulement des questions sur la qualité statistique des chiffres, mais aussi sur le risque de divulgation statistique. Le principe du contrôle de la divulgation statistique ne dépend pas de la taille des groupes sur lesquels les statistiques sont basées. Cependant, le risque de divulgation dépend de la taille du groupe : plus un groupe est petit, plus le risque est élevé. Les méthodes classiques de gestion du contrôle de la divulgation statistique lorsque la taille des groupes est réduite comprennent la suppression de données et le regroupement des catégories. Pour l’essentiel, ces méthodes consistent à augmenter la taille (moyenne) des groupes. Des approches plus récentes incluent des méthodes de perturbation des données visant à maintenir des groupes de petite taille pour préserver le plus d’information possible, tout en réduisant suffisamment le risque de divulgation. Dans le présent article, nous mentionnerons quelques exemples européens de statistiques sur des groupes types présentant un intérêt particulier et évoquerons les implications sur le contrôle de la divulgation statistique. Nous aborderons, en outre, certains problèmes liés à l’utilisation de méthodes de perturbation des données, à savoir leur incidence sur le risque de divulgation et sur l’utilité, ainsi que les défis liés à une bonne communication à ce sujet.Date de diffusion : 2024-03-25
- Précédent Go to previous page of Tout results
- 1 (actuel) Go to page 1 of Tout results
- 2 Go to page 2 of Tout results
- 3 Go to page 3 of Tout results
- 4 Go to page 4 of Tout results
- 5 Go to page 5 of Tout results
- 6 Go to page 6 of Tout results
- 7 Go to page 7 of Tout results
- 8 Go to page 8 of Tout results
- 9 Go to page 9 of Tout results
- Suivant Go to next page of Tout results
Données (1)
Données (1) ((1 result))
- 1. Statistiques historiques du Canada ArchivéTableau : 11-516-XDescription :
La deuxième édition des Statistiques historiques du Canada a été produite conjointement par la Fédération canadienne des sciences sociales et Statistique Canada, en 1983. Cet ouvrage comprend environ 1 088 tableaux statistiques sur la situation sociale, économique et institutionnelle du Canada, du début de la Confédération, en 1867, au milieu des années 70. Les tableaux sont disposés en sections, lesquelles comportent une introduction qui explique le contenu de chaque section ainsi que les sources principales de données pour chaque tableau, et des notes explicatives générales concernant les statistiques. Dans la plupart des cas, la description des séries individuelles est suffisante pour permettre aux lecteurs de les utiliser sans avoir à consulter les nombreuses sources dont il est fait état dans la publication.
La version électronique de cette publication historique est accessible dans le site Internet de Statistique Canada, à titre de document téléchargeable sans frais : texte en HTML et tous les tableaux sous forme de chiffriers électroniques individuels en format csv (qui permet le visionnement ou le téléchargement direct).
Date de diffusion : 1999-07-29
Analyses (75)
Analyses (75) (0 to 10 of 75 results)
- Articles et rapports : 11-522-X202500100001Description : Les différents secteurs utilisent de plus en plus la génération de données synthétiques (GDS) pour partager et augmenter des données tout en protégeant la vie privée ainsi que pour en éliminer les biais. Chaque fois qu'on utilise cet outil, on doit avoir recours à un ensemble distinct de mesures d'évaluation pour tenir compte de la stochasticité du processus de GDS : la vulnérabilité liée à la divulgation des membres et des attributs est essentielle pour protéger la vie privée; la fidélité et l'utilité des tâches en aval s'appliquent de manière plus générale; l'équité et la diversité sont des facteurs pertinents pour éliminer les biais et augmenter les données, respectivement. En présentant les données probantes accumulées et en examinant des études de cas modèles, il est montré que la GDS peut offrir un bon rendement dans bon nombre de ces cas d'utilisation. Dans le présent document les principaux enseignements tirés des expériences en matière de données synthétiques sur la santé sont également partagées.Date de diffusion : 2025-09-08
- 2. Analyse automatisée des documents pour le Compte des flux physiques des matières plastiques ArchivéArticles et rapports : 11-522-X202500100005Description : Le Compte des flux physiques des matières plastiques (CFPMP) vise à améliorer l'analyse environnementale et économique en suivant les flux des matières plastiques dans l'économie canadienne. Afin de rationaliser ce processus complexe, le projet a tiré parti des techniques avancées de traitement du langage naturel (TLN), dont les grands modèles de langage (GML), pour automatiser la classification sectorielle et la synthèse des répercussions de la pandémie de COVID-19 à partir des rapports d'entreprises. L'intégration de modèles d'apprentissage automatique et de méthodes de génération augmentée d'information contextuelle (GAIC) a permis de réduire considérablement la charge de travail manuel, d'améliorer l'efficacité de l'analyse des données et d'obtenir des aperçus de meilleure qualité.Date de diffusion : 2025-09-08
- Articles et rapports : 11-522-X202500100015Description : À l'heure actuelle, Statistique Canada n'a pas de directives officielles sur les règles de confidentialité pour la diffusion d'estimations sur petits domaines. Au cours des dernières années, il y a eu une demande croissante de la part des chercheurs des centres de données de recherche (CDR) pour l'élaboration de lignes directrices complètes en matière de confidentialité afin qu'ils puissent publier des estimations sur petits domaines dans leurs recherches. La présente analyse de confidentialité s'applique à l'estimation sur petits domaines au niveau de la région.Date de diffusion : 2025-09-08
- Articles et rapports : 11-522-X202500100016Description : L'adoption de la production de données synthétiques comme mesure de confidentialité augmente dans les organismes statistiques du monde entier, y compris à Statistique Canada. Cette approche offre une solution de rechange à la diffusion classique de fichiers publics anonymisés de microdonnées, répondant ainsi aux préoccupations en matière de protection de la vie privée et d'utilité des données. La création de données synthétiques présente toutefois des défis au niveau de l'évaluation et de l'atténuation du risque de divulgation. Le présent article passe en revue les différents types de risques de divulgation, soit la divulgation d'attribut, la divulgation de données d'adhésion et la divulgation de l'identité, et présente certaines des méthodes connexes pour mesurer le risque. L'article présente les grandes mesures d'évaluation des risques et examine les méthodes pratiques de contrôle de la divulgation dans le cadre de la synthèse des données. Les méthodes d'évaluation des risques de divulgation produisent habituellement une mesure qui peut servir à jauger le risque, mais il y a peu de consensus sur les valeurs limites de ces mesures. Il importe également de souligner l'importance de trouver le juste équilibre entre l'utilité et la confidentialité, ce qui nécessite une discussion plus approfondie dans le contexte de ces méthodes. L'article se termine en offrant des idées et des recommandations sur la gestion du risque de divulgation lors de la création de données synthétiques. Il offre également quelques perspectives sur les orientations futures de la recherche et les répercussions pratiques de la gestion des risques de divulgation par l'entremise des données synthétiques.Date de diffusion : 2025-09-08
- Articles et rapports : 11-522-X202500100017Description : Les services publics ont des renseignements essentiels sur la consommation d'énergie et les caractéristiques des bâtiments, des renseignements que les organismes gouvernementaux peuvent utiliser pour améliorer leurs analyses correspondantes. Ces données, de nature confidentielle, sont toutefois associées aux enregistrements de clients. Les données sur les bâtiments et la consommation d'énergie peuvent être trop délicates pour être partagées. Souvent, les versions agrégées de ces données sont échangées en vertu de contrats très restrictifs, ce qui limite le nombre de statistiques qui peuvent en être extraites. Avec l'avancement des techniques génératives d'apprentissage automatique, Statistique Canada et Ressources naturelles Canada ont évalué s'il était possible d'utiliser ces modèles pour produire des versions synthétiques des données sur les services publics qui peuvent être échangées intégralement avec les organismes qui en font la demande. Un service public peut créer ces ensembles de données synthétiques dans le cadre d'un programme exécuté localement. Les extrants peuvent être approuvés avant d'être envoyés. Ces travaux ont permis d'établir que les services publics peuvent utiliser certains modèles génératifs pour produire de nouvelles versions d'un ensemble de données, ainsi que de recenser les problèmes qui doivent être résolus avant de mettre en œuvre le tout en pratique. Des modèles tabulaires et de séries temporelles ont été mis à l'essai pour différents scénarios d'échange de données. Le modèle TimeGAN a permis de saisir les pics et les creux de consommation d'énergie au cours d'une journée donnée en respectant des exigences de calcul raisonnables. Bien que ce processus prenne plusieurs jours avant que les quantités d'énergie annuelles totalisent des milliers d'enregistrements de clients, de nouvelles initiatives d'échange de données peuvent être mises en œuvre entre les services publics et les organismes nationaux de statistique, tout en gérant les risques liés à la protection des renseignements personnels. Au fur et à mesure que les travaux avanceront dans le cadre des futures phases qui se dérouleront auprès de vrais partenaires des services publics, la confiance envers ces approches peut se renforcer. On pourra commencer à mettre à l'essai celles-ci en utilisant des données réelles fournies par de réels détenteurs de données.Date de diffusion : 2025-09-08
- Articles et rapports : 11-522-X202500100026Description : En 2022, le Canada est devenu le premier pays à diffuser des informations statistiques sur ses populations transgenre et non binaire selon les données de son recensement. De plus, à la suite d'une directive gouvernementale pancanadienne émise en 2018, les enquêtes de Statistique Canada collectent et diffusent par défaut des informations sur le genre plutôt que le sexe à la naissance. En raison de la taille des populations transgenre et non binaire, la diffusion sécuritaire d'informations statistiques à des niveaux géographiques détaillés présente un défi.Date de diffusion : 2025-09-08
- Articles et rapports : 12-001-X202400200008Description : Lorsqu’ils souhaitent diffuser des fichiers à grande diffusion pour des données confidentielles, les organismes de statistique peuvent générer des données entièrement synthétiques. Nous proposons une méthode pour construire des données entièrement synthétiques à partir d’enquêtes dont les données sont recueillies selon des plans d’échantillonnage complexes. Notre méthode respecte la stratégie générale proposée par Rubin (1993). Plus précisément, nous générons des pseudo-populations en appliquant la méthode du bootstrap bayésien en population finie pondéré pour tenir compte des poids d’enquête, tirons des échantillons aléatoires simples de ces pseudo-populations, estimons des modèles de synthèse en utilisant ces échantillons aléatoires simples et diffusons des données simulées tirées des modèles sous la forme de fichiers à grande diffusion. Pour faciliter l’estimation de la variance, nous utilisons le cadre d’imputation multiple et deux stratégies de génération de données. Dans la première, nous générons plusieurs ensembles de données à partir de chaque échantillon aléatoire simple. Dans la seconde, nous générons un seul ensemble de données synthétiques à partir de chaque échantillon aléatoire simple. Nous présentons des règles de combinaison de l’imputation multiple pour chaque scénario. Nous illustrons les propriétés d’échantillonnage répété des règles de combinaison au moyen d’études par simulations, ce qui comprend des comparaisons avec la génération de données synthétiques en fonction de méthodes de pseudo-vraisemblance. Nous appliquons les méthodes proposées à un sous-ensemble de données tirées de l’American Community Survey.Date de diffusion : 2024-12-20
- Articles et rapports : 11-633-X2024002Description : L’éthique des données est une branche de l’éthique qui soulève les enjeux relatifs à l’utilisation appropriée des données tout au long de leur cycle de vie et qui identifie les pratiques et les actions permissibles dans ce domaine. Cette discipline est mise en œuvre par le Secrétariat à l’éthique des données (SED) de Statistique Canada au moyen d’examens éthiques. Le processus d’examen éthique est une conséquence directe de l’adoption du Cadre de nécessité et de proportionnalité . L’objectif du présent document est de décrire les fondements et l’objectif de ces examens. Cela peut aider les Canadiennes et les Canadiens à mieux comprendre le travail du SED et la façon dont Statistique Canada justifie ces acquisitions de données.Date de diffusion : 2024-12-20
- Articles et rapports : 11-522-X202200100007Description : Dans le contexte de la disponibilité de sources de données plus vastes et plus diverses, les instituts statistiques en Europe sont enclins à publier des statistiques sur des groupes plus petits qu’auparavant. En outre, des épisodes mondiaux à forte incidence, comme la crise de la COVID-19 et la situation en Ukraine, peuvent également nécessiter des statistiques sur des sous-groupes particuliers de personnes. La publication de données concernant de petits groupes ciblés soulève non seulement des questions sur la qualité statistique des chiffres, mais aussi sur le risque de divulgation statistique. Le principe du contrôle de la divulgation statistique ne dépend pas de la taille des groupes sur lesquels les statistiques sont basées. Cependant, le risque de divulgation dépend de la taille du groupe : plus un groupe est petit, plus le risque est élevé. Les méthodes classiques de gestion du contrôle de la divulgation statistique lorsque la taille des groupes est réduite comprennent la suppression de données et le regroupement des catégories. Pour l’essentiel, ces méthodes consistent à augmenter la taille (moyenne) des groupes. Des approches plus récentes incluent des méthodes de perturbation des données visant à maintenir des groupes de petite taille pour préserver le plus d’information possible, tout en réduisant suffisamment le risque de divulgation. Dans le présent article, nous mentionnerons quelques exemples européens de statistiques sur des groupes types présentant un intérêt particulier et évoquerons les implications sur le contrôle de la divulgation statistique. Nous aborderons, en outre, certains problèmes liés à l’utilisation de méthodes de perturbation des données, à savoir leur incidence sur le risque de divulgation et sur l’utilité, ainsi que les défis liés à une bonne communication à ce sujet.Date de diffusion : 2024-03-25
- Stats en bref : 11-001-X202402237898Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique CanadaDate de diffusion : 2024-01-22
- Précédent Go to previous page of Analyses results
- 1 (actuel) Go to page 1 of Analyses results
- 2 Go to page 2 of Analyses results
- 3 Go to page 3 of Analyses results
- 4 Go to page 4 of Analyses results
- 5 Go to page 5 of Analyses results
- 6 Go to page 6 of Analyses results
- 7 Go to page 7 of Analyses results
- 8 Go to page 8 of Analyses results
- Suivant Go to next page of Analyses results
Références (12)
Références (12) (0 to 10 of 12 results)
- Enquêtes et programmes statistiques — Documentation : 11-633-X2024004Description : La base de données longitudinales sur l’immigration (BDIM) est une source importante et complète de données contribuant à mieux comprendre le comportement économique des immigrants. Il s’agit du seul ensemble annuel de données canadiennes permettant d’étudier les caractéristiques des immigrants au Canada au moment de leur admission ainsi que leur situation économique et leur mobilité régionale (interprovinciale) sur plus de 35 ans.Date de diffusion : 2024-12-09
- Enquêtes et programmes statistiques — Documentation : 11-633-X2024001Description : La base de données longitudinales sur l’immigration (BDIM) est une source importante et complète de données contribuant à mieux comprendre le comportement économique des immigrants. Il s’agit du seul ensemble annuel de données canadiennes permettant d’étudier les caractéristiques des immigrants au Canada au moment de leur admission ainsi que leur situation économique et leur mobilité régionale (interprovinciale) sur plus de 35 ans.Date de diffusion : 2024-01-22
- Enquêtes et programmes statistiques — Documentation : 32-26-0006Description : Ce rapport fournit des renseignements sur la qualité des données relatives au Couplage agriculture–population, comme les sources d’erreur, le processus d’appariement, les taux de réponse, les taux d’imputation, l’échantillonnage, la pondération, les méthodes de contrôle de la divulgation et les indicateurs de la qualité des données.Date de diffusion : 2023-08-25
- Enquêtes et programmes statistiques — Documentation : 11-633-X2022009Description : La base de données longitudinales sur l’immigration (BDIM) est une source importante et complète de données contribuant à mieux comprendre le comportement économique des immigrants. Il s’agit du seul ensemble annuel de données canadiennes permettant d’étudier les caractéristiques des immigrants au Canada au moment de leur admission ainsi que leur situation économique et leur mobilité régionale (interprovinciale) sur plus de 35 ans.
Ce rapport traitera des sources de données, des concepts et des variables de la BDIM, du couplage d’enregistrements, du traitement des données, de la diffusion, de l’évaluation des données et des indicateurs de qualité, de la comparabilité avec d’autres ensembles de données relatives à l’immigration ainsi que des analyses que permet la BDIM.
Date de diffusion : 2022-12-05 - Fichiers et documentation sur la géographie : 12-572-XDescription :
La Classification géographique type (CGT) fournit une structure de classification systématique pour toutes les régions géographiques au Canada. La CGT est le système de classification officielle utilisé pour le Recensement de la population et d’autres enquêtes de Statistique Canada.
La classification est divisée en deux volumes, soit le volume I, La classification et le volume II, Cartes de référence.
Le volume II renferme des cartes de référence indiquant les limites, les noms, les codes et l'emplacement des régions géographiques figurant dans la classification. Les cartes de référence montrent les subdivisions de recensement, les divisions de recensement, les régions métropolitaines de recensement, les agglomérations de recensement, les zones d'influence métropolitaine de recensement et les régions économiques. Les définitions de ces termes se trouvent dans le Volume I, La classification. Le volume I renferme une description de la classification et des régions géographiques normalisées connexes et comprend les noms de localité.
Les cartes du volume II peuvent être téléchargées en format PDF à partir de notre site Web.
Date de diffusion : 2022-02-09 - Enquêtes et programmes statistiques — Documentation : 11-522-X201300014285Description :
L’Enquête nationale auprès des ménages (ENM) de 2011 est une enquête à participation volontaire qui a remplacé le questionnaire complet obligatoire traditionnel du recensement de la population du Canada. L’ENM a été réalisée auprès d’un échantillon d’environ 30 % des ménages canadiens et a donné un taux de réponse pondéré selon le plan de sondage de 77 %. Comparativement, le dernier questionnaire complet du recensement a été envoyé à 20 % des ménages et a produit un taux de réponse de 94 %. Au moyen des données du questionnaire complet, Statistique Canada produit habituellement deux fichiers de microdonnées à grande diffusion (FMGD) : le FMGD des particuliers et le FMGD hiérarchique. Ces fichiers donnent tous deux des renseignements sur les particuliers, mais le FMGD hiérarchique fournit aussi des renseignements sur les liens entre les particuliers d’un même ménage ou d’une même famille. Afin de produire, en se basant sur les données de l’ENM, deux FMGD qui couvrent uniformément l’ensemble du pays et qui ne se chevauchent pas, nous avons appliqué une stratégie spéciale de sous-échantillonnage. Les analyses de confidentialité sont devenues plus difficiles, en raison des nombreuses nouvelles variables, de l’information géographique plus détaillée et de la nature volontaire de l’ENM. Le présent article décrit la méthodologie des FMGD de 2011 et la façon dont elle établit un équilibre entre le besoin de disposer de plus d’information et la nécessité que le risque de divulgation soit faible.
Date de diffusion : 2014-10-31 - Avis et consultations : 92-132-XDescription :
Ce rapport synthétise les commentaires reçus pendant la deuxième tournée de consultations du Recensement de 2006. Comme les consultations précédentes portant sur le Recensement de 2006, cette deuxième tournée de consultations intégrait les discussions sur le programme de diffusion, le contenu du questionnaire ainsi que la géographie du recensement. Toutefois, l'emphase de cette deuxième tournée de consultations était principalement dirigée sur le programme de diffusion du Recensement de 2001 et les directions proposées de la géographie pour 2006. Les consultations se sont déroulées de janvier à juin 2004. Plus de 1 000 commentaires ont été reçus soit par soumission écrites ou par l'entremise de 40 sessions organisées à travers le Canada.
Le rapport présente la rétroaction soumise par les utilisateurs lors de la deuxième tournée de consultations. Le rapport ne couvre que les commentaires ayant trait au programme de diffusion et à la géographie du recensement. En plus des commentaires des utilisateurs, l'information sur les paramètres web se veut d'être un outil précieux quant à l'évaluation de l'accessibilité des tableaux de données offert au grand public. À cet effet, on retrouve les consultations de page intégrées au rapport.
Certaines hypothèses de planification touchant la production et la diffusion des produits du Recensement de 2006 sont aussi incluses dans ce rapport.
Date de diffusion : 2005-05-31 - Avis et consultations : 92-131-GDescription :
Ce guide est conçu de façon à aider les utilisateurs à communiquer à Statistique Canada leurs idées et suggestions concernant la gamme de produits et services du recensement de 2001. On y trouve une série de questions portant sur divers problèmes et sujets se rapportant à la stratégie de diffusion du recensement de 2001. Ce document porte sur de nombreux aspects de la diffusion des données du recensement. Le lecteur a toutefois le loisir de s'attarder aux sections qui l'intéressent d'une façon plus particulière. De plus, à travers ce processus de consultation, les utilisateurs sont invités à soumettre leurs commentaires sur tout autre aspect du recensement.
Date de diffusion : 2004-04-08 - Enquêtes et programmes statistiques — Documentation : 75F0002M2003002Description :
Cette série comprend de la documentation détaillée sur l'évolution du revenu, notamment les enjeux liés à la conception de l'enquête, l'évaluation qualitative des données et les recherches exploratoires lors de l'Enquête sur la dynamique du travail et du revenu (EDTR) de 2000.
Date de diffusion : 2003-06-11 - Enquêtes et programmes statistiques — Documentation : 75F0002M199303ADescription :
Ce document vise à fournir une vue d'ensemble de la stratégie proposée pour les fichiers de microdonnées longitudinales de l'Enquête sur la dynamique du travail et du revenu (EDTR).
Date de diffusion : 1995-12-30