Techniques statistiques

Résultats

Tout (207)

Tout (207) (0 to 10 of 207 results)

1. Études analytiques : méthodes et références
Revues et périodiques : 11-633-X
Description : Les documents de cette série traitent des méthodes utilisées pour produire des données qui seront employées pour effectuer des études analytiques à Statistique Canada sur l’économie, la santé et la société. Ils ont pour but de renseigner les lecteurs sur les méthodes statistiques, les normes et les définitions utilisées pour élaborer des bases de données à des fins de recherche. Tous les documents de la série ont fait l’objet d’un examen par les pairs et d’une révision institutionnelle, afin de veiller à ce qu’ils soient conformes au mandat de Statistique Canada et qu’ils respectent les normes généralement reconnues régissant les bonnes pratiques professionnelles.
Date de diffusion : 2026-04-24
2. Effets d’erreurs de spécification de modèle sur les estimateurs sur petits domaines
Articles et rapports : 12-001-X202500200001
Description : Des modèles de régression à erreurs emboîtées sont couramment utilisés pour intégrer des variables auxiliaires propres aux unités afin d’améliorer les estimations sur petits domaines. En cas d’erreur de spécification relative à la structure de la moyenne du modèle, l’erreur quadratique moyenne de prédiction (EQMP) fondée sur le plan des meilleurs prédicteurs linéaires sans biais empiriques (MPLSBE) augmente généralement. La méthode de meilleure prédiction observée (MPO) a été proposée dans le but d’améliorer l’EQMP fondée sur le plan par rapport à la méthode MPLSBE. Dans la présente étude, nous menons des expériences de simulation de Monte Carlo pour comprendre l’effet d’erreurs de spécification de la structure de la moyenne sur différents estimateurs sur petits domaines. Nos résultats laissent entendre que la méthode MPO reposant sur des variables auxiliaires au niveau de l’unité ne fournit pas de meilleurs résultats que la méthode MPLSBE pour ce qui est de l’EQMP fondée sur le plan, sauf si le nombre de petits domaines m est extrêmement grand. À l’inverse, les rendements de la méthode MPO s’améliorent nettement lorsque des variables auxiliaires au niveau du domaine sont utilisées. La présente étude inclut à la fois des données analytiques et numériques pour illustrer ces observations; elle fournit en outre des renseignements pratiques pour faire face aux erreurs de spécification de modèle dans le contexte d’estimations sur petits domaines (EPD).
Date de diffusion : 2025-12-23
3. Intégration d’échantillons probabilistes et non probabilistes grâce à l’imputation massive basée sur l’apprentissage profond
Articles et rapports : 12-001-X202500200007
Description : Les échantillons probabilistes sont considérés comme la référence pour recueillir des renseignements dans les études basées sur la population, mais l’on utilise fréquemment, dans la pratique, des échantillons non probabilistes en raison de leur faible coût, de leur commodité et de l’absence de base de sondage pour l’enquête. Les estimations naïves fondées sur des échantillons non probabilistes risquent, en l’absence d’ajustements, d’être trompeuses en raison d’un biais de sélection. Une approche valide d’intégration des données comprenant l’imputation massive, la pondération par le score de propension et le calage a récemment été utilisée pour améliorer la représentativité des échantillons non probabilistes. L’efficacité de l’approche d’imputation massive dépend des hypothèses sous-jacentes du modèle. Dans le présent article, nous proposons d’utiliser l’apprentissage profond pour l’imputation massive dans une combinaison d’échantillons probabilistes et non probabilistes et de le comparer à plusieurs approches modernes d’imputation massive basée sur l’apprentissage automatique, y compris la modélisation additive généralisée, l’arbre de régression, la forêt aléatoire et le renforcement extrême du gradient (XGBoosting). Dans l’étude par simulation, les approches basées sur l’apprentissage profond se sont révélées plus robustes et efficaces que d’autres approches d’imputation massive contre l’invalidation des hypothèses sous-jacentes du modèle dans les scénarios de non-linéarité.
Date de diffusion : 2025-12-23
4. Estimation par la régression généralisée en cas d’erreur de spécification du plan de sondage
Articles et rapports : 12-001-X202500200008
Description : Une estimation à partir de données d’enquête classique fondée sur le plan repose sur un plan de sondage adéquatement défini afin d’obtenir une inférence valable. Nous tenons compte des propriétés de l’estimation par régression en cas d’erreur de spécification du plan de sondage, dans lequel les probabilités d’inclusion nominale et réelle ne sont pas nécessairement les mêmes. Cette situation générale d’erreur de spécification d’un plan de sondage comporte beaucoup de défis dans le contexte moderne dans lequel sont réalisées les enquêtes. Dans ce contexte, une analyse asymptotique de l’estimateur par la régression, une expression du biais et une expression de la variance sont présentées. En outre, un estimateur de la variance convergent est obtenu et une expression qui estime le biais en partie ou en totalité est présentée. Cette dernière expression peut être utilisée en tant qu’indicateur de la présence d’un biais causé par l’erreur de spécification d’un spécialiste. Une étude par simulation est menée afin d’étayer la théorie exposée.
Date de diffusion : 2025-12-23
5. Cartographie de la localisation et de la colocalisation des industries au niveau du quartier : une approche de densité du noyau spatial
Articles et rapports : 18-001-X2025001
Description : Cet article porte l’analyse des grappes d’entreprises à une échelle géographique plus granulaire en développant une méthodologie d’identification des grappes d’entreprises à l’échelle du quartier. La méthode proposée identifie les grappes d’entreprises au niveau des, qui est l’une des unités spatiales d’analyse les plus granulaires définies par Statistique Canada. La méthode est mise au point et appliquée à quatre régions métropolitaines de recensement (RMR) de tailles différentes et pour différentes spécifications de grappes industrielles, y compris les groupes simples à 2 chiffres du Système de classification des industries de l’Amérique du Nord (SCIAN) ainsi que les grappes d’industries résultant de regroupements de codes SCIAN, tels que définis par Delgado et coll. (2014).
Date de diffusion : 2025-10-10
6. Couplage efficace d'enregistrements pour les grands ensembles de données, selon les noms d'entreprise Archivé
Articles et rapports : 11-522-X202500100019
Description : Le couplage d'enregistrements exact et efficace s'avère crucial pour veiller à ce que le Registre statistique des entreprises (RSE) de Statistique Canada soit exhaustif et actuel. Le couplage de listes externes d'entreprises au RSE selon le nom présente des défis sur le plan méthodologique et des calculs, surtout au fur et à mesure que les volumes de données augmentent. Le présent article décrit une méthodologie évolutive qui se fonde sur des techniques d'établissement de blocs pour limiter l'espace de recherche informatique, et intègre de multiples mesures de similarité, des distances d'édition et du chevauchement de n-grammes aux méthodes fondées sur la vectorisation utilisant Sentence-BERT (SBERT), afin de déceler les paires appariées probables. En jumelant des comparaisons simples au niveau des caractères à des méthodes de vectorisation sémantique plus avancées, l'approche peut s'adapter à diverses conventions nominales et différents degrés de complexité. Même si cela ne garantit pas une précision supérieure dans toutes les situations, cette méthode offre un équilibre pragmatique entre la faisabilité des calculs et la qualité du couplage.
Date de diffusion : 2025-09-08
7. Évaluation de l'exactitude lors d'un appariement par vagues Archivé
Articles et rapports : 11-522-X202500100020
Description : Au sein de Statistique Canada, de nombreux ensembles de données sont appariés à l'aide de quasi-identificateurs, comme le prénom, le nom de famille ou l'adresse. En pareil cas, les erreurs de couplage peuvent être une préoccupation et doivent donc être mesurées. À cet égard, des études menées antérieurement ont révélé que cette évaluation peut s'appuyer sur la modélisation du nombre de liens d'un enregistrement donné, tout en tenant compte de toutes les interactions qui existent entre les variables de couplage et en se passant de vérifications manuelles, aussi longtemps que la décision de lier deux enregistrements ne fait pas intervenir d'autres enregistrements. Dans le cadre de la présente communication, la méthodologie utilisée est adaptée à une catégorie de stratégies pratiques, lesquelles ne respectent pas cette contrainte en liant les enregistrements par vagues successives, où une vague donnée lie un sous-ensemble d'enregistrements qui ne sont pas liés dans les vagues précédentes. En particulier, le couplage peut être fondé sur une vague déterministe suivie d'une vague probabiliste.
Date de diffusion : 2025-09-08
8. Sélection de seuils basée sur le modèle pour effectuer des couplages dans le domaine agricole Archivé
Articles et rapports : 11-522-X202500100021
Description : La sélection optimale de seuils représente un défi crucial au chapitre du couplage probabiliste, ayant d'importantes répercussions sur l'exactitude et la fiabilité des ensembles de données couplés. Le présent document analyse le rendement du modèle de voisinage, un modèle d'erreur récemment proposé qui modélise des erreurs de couplage en fonction du nombre de couplages de chaque enregistrement. On a évalué trois algorithmes de sélection des seuils à l'aide du modèle de voisinage, mettant en évidence les formes et les limites de chacun. On a analysé leur rendement à l'aide d'études de simulation, qui ont montré que les méthodes utilisant le modèle de voisinage ont obtenu un biais relatif inférieur par rapport à deux méthodes établies pour la sélection des seuils. En outre, l'utilité pratique a été validée par des tests d'adéquation réalisés sur quatre ensembles de données agricoles, ce qui montre que le modèle peut être utilisé dans des applications de la vie réelle.
Date de diffusion : 2025-09-08
9. Remaniement : processus d'identification des partenariats T1 Archivé
Articles et rapports : 11-522-X202500100022
Description : Au Canada, le formulaire d'impôt T1 est utilisé pour la déclaration du revenu personnel, qu'il ait été gagné en tant que personne employée ou travailleur autonome. Le revenu provenant d'un travail autonome, ou « revenu d'entreprise T1 », est déclaré par des entreprises détenues par une seule personne ou en partenariat. Un partenariat T1 comprend deux entités juridiques ou plus qui font une déclaration conjointe pour une entreprise partagée. Les données d'entreprises T1 sont reçues sous forme de déclarations individuelles; ce qui signifie que les données pour les partenariats sont reçues séparément pour chaque partenaire. Le couplage d'enregistrements interne dans la base de données T1 sur les entreprises est effectué pour identifier les partenariats et prévenir le surdénombrement dans la population finale des entreprises T1. Ce nouveau processus d'identification des partenariats T1 tire parti de nouveaux algorithmes, comme le groupement numérique DBSCAN par appariement flou, pour déterminer les couplages internes. La théorie des graphes est utilisée pour bâtir la liste des partenariats à partir des paires de rangées relevées dans le processus de couplage.
Date de diffusion : 2025-09-08
10. Élaboration de poids ajustés en fonction du couplage pour rendre compte du genre dans la Cohorte santé et environnement du recensement canadien de 2021 Archivé
Articles et rapports : 11-522-X202500100023
Description : La plus récente Cohorte santé et environnement du recensement canadien (CSERCan) s'inscrit dans une série de couplages de microdonnées fondés sur la population qui appuient la recherche en santé de la population selon certaines caractéristiques démographiques, sociales et économiques. La CSERCan de 2021 contient 95,5 % des enregistrements de de l'échantillon du questionnaire détaillé du Recensement de 2021. Les enregistrements ne pouvant pas être couplés aux données du Dépôt d'enregistrements dérivés (DED) et ceux présumés être des doublons représentent les 4,5 % restants. Les poids principaux et les poids de répliques rajustés en fonction du couplage permettent aux chercheurs d'estimer et d'évaluer la variance des mesures agrégées de la santé de la population en présence d'appariements manquants, afin de mieux comprendre les expériences des différents groupes de population.
Date de diffusion : 2025-09-08

Données (1)

Données (1) ((1 result))

1. Indice de divergence de revenu par secteur de recensement
Tableau : 11-10-0074-01
Géographie : Secteur de recensement
La fréquence : Occasionnelle
Description :
L'indice de divergence (indice-D) est une mesure de la diversité des niveaux de revenus des familles composant les quartiers. Il compare les répartitions discrètes des revenus de quartiers (secteurs de recensement ou SR) à une répartition de base, soit les quintiles de revenu de la région métropolitaine de recensement (RMR) du quartier.

Date de diffusion : 2020-06-22

Analyses (199)

Analyses (199) (0 to 10 of 199 results)

1. Études analytiques : méthodes et références
Revues et périodiques : 11-633-X
Description : Les documents de cette série traitent des méthodes utilisées pour produire des données qui seront employées pour effectuer des études analytiques à Statistique Canada sur l’économie, la santé et la société. Ils ont pour but de renseigner les lecteurs sur les méthodes statistiques, les normes et les définitions utilisées pour élaborer des bases de données à des fins de recherche. Tous les documents de la série ont fait l’objet d’un examen par les pairs et d’une révision institutionnelle, afin de veiller à ce qu’ils soient conformes au mandat de Statistique Canada et qu’ils respectent les normes généralement reconnues régissant les bonnes pratiques professionnelles.
Date de diffusion : 2026-04-24
2. Effets d’erreurs de spécification de modèle sur les estimateurs sur petits domaines
Articles et rapports : 12-001-X202500200001
Description : Des modèles de régression à erreurs emboîtées sont couramment utilisés pour intégrer des variables auxiliaires propres aux unités afin d’améliorer les estimations sur petits domaines. En cas d’erreur de spécification relative à la structure de la moyenne du modèle, l’erreur quadratique moyenne de prédiction (EQMP) fondée sur le plan des meilleurs prédicteurs linéaires sans biais empiriques (MPLSBE) augmente généralement. La méthode de meilleure prédiction observée (MPO) a été proposée dans le but d’améliorer l’EQMP fondée sur le plan par rapport à la méthode MPLSBE. Dans la présente étude, nous menons des expériences de simulation de Monte Carlo pour comprendre l’effet d’erreurs de spécification de la structure de la moyenne sur différents estimateurs sur petits domaines. Nos résultats laissent entendre que la méthode MPO reposant sur des variables auxiliaires au niveau de l’unité ne fournit pas de meilleurs résultats que la méthode MPLSBE pour ce qui est de l’EQMP fondée sur le plan, sauf si le nombre de petits domaines m est extrêmement grand. À l’inverse, les rendements de la méthode MPO s’améliorent nettement lorsque des variables auxiliaires au niveau du domaine sont utilisées. La présente étude inclut à la fois des données analytiques et numériques pour illustrer ces observations; elle fournit en outre des renseignements pratiques pour faire face aux erreurs de spécification de modèle dans le contexte d’estimations sur petits domaines (EPD).
Date de diffusion : 2025-12-23
3. Intégration d’échantillons probabilistes et non probabilistes grâce à l’imputation massive basée sur l’apprentissage profond
Articles et rapports : 12-001-X202500200007
Description : Les échantillons probabilistes sont considérés comme la référence pour recueillir des renseignements dans les études basées sur la population, mais l’on utilise fréquemment, dans la pratique, des échantillons non probabilistes en raison de leur faible coût, de leur commodité et de l’absence de base de sondage pour l’enquête. Les estimations naïves fondées sur des échantillons non probabilistes risquent, en l’absence d’ajustements, d’être trompeuses en raison d’un biais de sélection. Une approche valide d’intégration des données comprenant l’imputation massive, la pondération par le score de propension et le calage a récemment été utilisée pour améliorer la représentativité des échantillons non probabilistes. L’efficacité de l’approche d’imputation massive dépend des hypothèses sous-jacentes du modèle. Dans le présent article, nous proposons d’utiliser l’apprentissage profond pour l’imputation massive dans une combinaison d’échantillons probabilistes et non probabilistes et de le comparer à plusieurs approches modernes d’imputation massive basée sur l’apprentissage automatique, y compris la modélisation additive généralisée, l’arbre de régression, la forêt aléatoire et le renforcement extrême du gradient (XGBoosting). Dans l’étude par simulation, les approches basées sur l’apprentissage profond se sont révélées plus robustes et efficaces que d’autres approches d’imputation massive contre l’invalidation des hypothèses sous-jacentes du modèle dans les scénarios de non-linéarité.
Date de diffusion : 2025-12-23
4. Estimation par la régression généralisée en cas d’erreur de spécification du plan de sondage
Articles et rapports : 12-001-X202500200008
Description : Une estimation à partir de données d’enquête classique fondée sur le plan repose sur un plan de sondage adéquatement défini afin d’obtenir une inférence valable. Nous tenons compte des propriétés de l’estimation par régression en cas d’erreur de spécification du plan de sondage, dans lequel les probabilités d’inclusion nominale et réelle ne sont pas nécessairement les mêmes. Cette situation générale d’erreur de spécification d’un plan de sondage comporte beaucoup de défis dans le contexte moderne dans lequel sont réalisées les enquêtes. Dans ce contexte, une analyse asymptotique de l’estimateur par la régression, une expression du biais et une expression de la variance sont présentées. En outre, un estimateur de la variance convergent est obtenu et une expression qui estime le biais en partie ou en totalité est présentée. Cette dernière expression peut être utilisée en tant qu’indicateur de la présence d’un biais causé par l’erreur de spécification d’un spécialiste. Une étude par simulation est menée afin d’étayer la théorie exposée.
Date de diffusion : 2025-12-23
5. Cartographie de la localisation et de la colocalisation des industries au niveau du quartier : une approche de densité du noyau spatial
Articles et rapports : 18-001-X2025001
Description : Cet article porte l’analyse des grappes d’entreprises à une échelle géographique plus granulaire en développant une méthodologie d’identification des grappes d’entreprises à l’échelle du quartier. La méthode proposée identifie les grappes d’entreprises au niveau des, qui est l’une des unités spatiales d’analyse les plus granulaires définies par Statistique Canada. La méthode est mise au point et appliquée à quatre régions métropolitaines de recensement (RMR) de tailles différentes et pour différentes spécifications de grappes industrielles, y compris les groupes simples à 2 chiffres du Système de classification des industries de l’Amérique du Nord (SCIAN) ainsi que les grappes d’industries résultant de regroupements de codes SCIAN, tels que définis par Delgado et coll. (2014).
Date de diffusion : 2025-10-10
6. Couplage efficace d'enregistrements pour les grands ensembles de données, selon les noms d'entreprise Archivé
Articles et rapports : 11-522-X202500100019
Description : Le couplage d'enregistrements exact et efficace s'avère crucial pour veiller à ce que le Registre statistique des entreprises (RSE) de Statistique Canada soit exhaustif et actuel. Le couplage de listes externes d'entreprises au RSE selon le nom présente des défis sur le plan méthodologique et des calculs, surtout au fur et à mesure que les volumes de données augmentent. Le présent article décrit une méthodologie évolutive qui se fonde sur des techniques d'établissement de blocs pour limiter l'espace de recherche informatique, et intègre de multiples mesures de similarité, des distances d'édition et du chevauchement de n-grammes aux méthodes fondées sur la vectorisation utilisant Sentence-BERT (SBERT), afin de déceler les paires appariées probables. En jumelant des comparaisons simples au niveau des caractères à des méthodes de vectorisation sémantique plus avancées, l'approche peut s'adapter à diverses conventions nominales et différents degrés de complexité. Même si cela ne garantit pas une précision supérieure dans toutes les situations, cette méthode offre un équilibre pragmatique entre la faisabilité des calculs et la qualité du couplage.
Date de diffusion : 2025-09-08
7. Évaluation de l'exactitude lors d'un appariement par vagues Archivé
Articles et rapports : 11-522-X202500100020
Description : Au sein de Statistique Canada, de nombreux ensembles de données sont appariés à l'aide de quasi-identificateurs, comme le prénom, le nom de famille ou l'adresse. En pareil cas, les erreurs de couplage peuvent être une préoccupation et doivent donc être mesurées. À cet égard, des études menées antérieurement ont révélé que cette évaluation peut s'appuyer sur la modélisation du nombre de liens d'un enregistrement donné, tout en tenant compte de toutes les interactions qui existent entre les variables de couplage et en se passant de vérifications manuelles, aussi longtemps que la décision de lier deux enregistrements ne fait pas intervenir d'autres enregistrements. Dans le cadre de la présente communication, la méthodologie utilisée est adaptée à une catégorie de stratégies pratiques, lesquelles ne respectent pas cette contrainte en liant les enregistrements par vagues successives, où une vague donnée lie un sous-ensemble d'enregistrements qui ne sont pas liés dans les vagues précédentes. En particulier, le couplage peut être fondé sur une vague déterministe suivie d'une vague probabiliste.
Date de diffusion : 2025-09-08
8. Sélection de seuils basée sur le modèle pour effectuer des couplages dans le domaine agricole Archivé
Articles et rapports : 11-522-X202500100021
Description : La sélection optimale de seuils représente un défi crucial au chapitre du couplage probabiliste, ayant d'importantes répercussions sur l'exactitude et la fiabilité des ensembles de données couplés. Le présent document analyse le rendement du modèle de voisinage, un modèle d'erreur récemment proposé qui modélise des erreurs de couplage en fonction du nombre de couplages de chaque enregistrement. On a évalué trois algorithmes de sélection des seuils à l'aide du modèle de voisinage, mettant en évidence les formes et les limites de chacun. On a analysé leur rendement à l'aide d'études de simulation, qui ont montré que les méthodes utilisant le modèle de voisinage ont obtenu un biais relatif inférieur par rapport à deux méthodes établies pour la sélection des seuils. En outre, l'utilité pratique a été validée par des tests d'adéquation réalisés sur quatre ensembles de données agricoles, ce qui montre que le modèle peut être utilisé dans des applications de la vie réelle.
Date de diffusion : 2025-09-08
9. Remaniement : processus d'identification des partenariats T1 Archivé
Articles et rapports : 11-522-X202500100022
Description : Au Canada, le formulaire d'impôt T1 est utilisé pour la déclaration du revenu personnel, qu'il ait été gagné en tant que personne employée ou travailleur autonome. Le revenu provenant d'un travail autonome, ou « revenu d'entreprise T1 », est déclaré par des entreprises détenues par une seule personne ou en partenariat. Un partenariat T1 comprend deux entités juridiques ou plus qui font une déclaration conjointe pour une entreprise partagée. Les données d'entreprises T1 sont reçues sous forme de déclarations individuelles; ce qui signifie que les données pour les partenariats sont reçues séparément pour chaque partenaire. Le couplage d'enregistrements interne dans la base de données T1 sur les entreprises est effectué pour identifier les partenariats et prévenir le surdénombrement dans la population finale des entreprises T1. Ce nouveau processus d'identification des partenariats T1 tire parti de nouveaux algorithmes, comme le groupement numérique DBSCAN par appariement flou, pour déterminer les couplages internes. La théorie des graphes est utilisée pour bâtir la liste des partenariats à partir des paires de rangées relevées dans le processus de couplage.
Date de diffusion : 2025-09-08
10. Élaboration de poids ajustés en fonction du couplage pour rendre compte du genre dans la Cohorte santé et environnement du recensement canadien de 2021 Archivé
Articles et rapports : 11-522-X202500100023
Description : La plus récente Cohorte santé et environnement du recensement canadien (CSERCan) s'inscrit dans une série de couplages de microdonnées fondés sur la population qui appuient la recherche en santé de la population selon certaines caractéristiques démographiques, sociales et économiques. La CSERCan de 2021 contient 95,5 % des enregistrements de de l'échantillon du questionnaire détaillé du Recensement de 2021. Les enregistrements ne pouvant pas être couplés aux données du Dépôt d'enregistrements dérivés (DED) et ceux présumés être des doublons représentent les 4,5 % restants. Les poids principaux et les poids de répliques rajustés en fonction du couplage permettent aux chercheurs d'estimer et d'évaluer la variance des mesures agrégées de la santé de la population en présence d'appariements manquants, afin de mieux comprendre les expériences des différents groupes de population.
Date de diffusion : 2025-09-08

Références (7)

Références (7) ((7 results))

1. Méthodologie des tables de mortalité pour le Canada, les provinces et les territoires
Enquêtes et programmes statistiques — Documentation : 84-538-X
Géographie : Canada
Description : Cette publication électronique présente la méthodologie sous-jacente à la production des tables de mortalité pour le Canada, les provinces et les territoires.
Date de diffusion : 2023-08-28
2. Guide du système du registre canadien du cancer, édition 2007 Archivé
Enquêtes et programmes statistiques — Documentation : 82-225-X200701010508
Description :
Aperçu du couplage des enregistrements décrit le processus utilisé dans le module de couplage des enregistrements du registre canadien du cancer. On y trouve les étapes suivantes : préparatifs avant le couplage ; pré-traitement ; couplage ; post-traitement ; analyse des groupes et choix d'une solution ; entrée des solutions ; et, traitement des solutions.
Date de diffusion : 2008-01-18
3. Le code postal comme clé de fusion de fichiers de données indépendants : le cas de l'appariement des données du Recensement canadien et d'un fichier administratif portant sur les résultats des élèves au Québec Archivé
Enquêtes et programmes statistiques — Documentation : 11-522-X20050019476
Description :
La communication montrera comment, avec les données publiées par Statistique Canada et disponibles à partir des bibliothèques membres de la CRÉPUQ, une approche d'appariement via le code postal permet de relier les données du fichier des résultats à un ensemble de variables contextuelles. Ces variables pourraient ainsi concourir à la production, à titre exploratoire, d'un indice servant à une meilleure explication de la performance différenciée des élèves des écoles. Sous l'angle des retombées, l'indice envisagé pourrait illustrer encore davantage les limites des classements d'élèves et d'écoles qui ne prennent pas suffisamment en compte ces informations.
Date de diffusion : 2007-03-02
4. L'approche intégrée des enquêtes économiques au Canada Archivé
Enquêtes et programmes statistiques — Documentation : 68-514-X
Description :
L'approche utilisée par Statistique Canada pour la collecte et la diffusion de données économiques a évolué depuis plusieurs décennies vers un système de collecte et d'estimation fortement intégré qui alimente le cadre du Système de comptabilité nationale du Canada.
L'élément clé de cette approche a été la création de l'Enquête unifiée auprès des entreprises, qui avait pour objet d'améliorer l'uniformité, la cohérence, l'ampleur et la profondeur des données des enquêtes-entreprises.
L'EUE a atteint cet objectif en regroupant dans un cadre commun un grand nombre d'enquêtes-entreprises annuelles du Canada. Ce cadre comprenait une seule base de sondage, un schéma pour le plan d'échantillonnage, l'harmonisation conceptuelle du contenu des enquêtes, divers moyens d'utiliser les données administratives pertinentes, une collecte intégrée des données, des outils de traitement et d'analyse, et un entrepôt central de données.
Date de diffusion : 2006-11-20
5. La Banque de données administratives longitudinales (DAL) et la Banque de données longitudinales sur les immigrants (BDIM) : création de la DAL_BDIM - Un document technique Archivé
Enquêtes et programmes statistiques — Documentation : 89-612-X
Description :
Ce rapport comprend une description de la structure et du couplage de deux bases de données : la Banque de données administratives longitudinales (DAL) et la Base de données longitudinales sur les immigrants (BDIM). La combinaison des deux produits offre un fichier couplé de données fiscales sur les immigrants ayant obtenu le droit d'établissement et leurs données caractéristiques sur l'immigration. Le rapport souligne la façon de combiner l'information, référé ici comme DAL_BDIM, améliore et complète les bases de données actuelles et distinctes. Dans ce rapport, on compare le fichier complet de la BDIM avec l'échantillon d'immigrants pour évaluer la représentativité du fichier de l'échantillon.
Date de diffusion : 2004-01-05
6. Établir le lien entre les évaluations provinciales des élèves et les évaluations nationales et internationales Archivé
Enquêtes et programmes statistiques — Documentation : 81-595-M2003005
Géographie : Canada
Description :
Dans ce document, on élabore des procédures techniques permettant aux ministères de l'Éducation d'établir un lien entre les tests provinciaux et les tests nationaux et internationaux afin de pouvoir comparer les normes et présenter les résultats selon une échelle commune.
Date de diffusion : 2003-05-29
7. Survol des questions touchant l'utilisation d'identificateurs personnels Archivé
Enquêtes et programmes statistiques — Documentation : 85-602-X
Description :
L'objet du présent rapport est de faire le survol des méthodes et techniques existantes qui utilisent les identificateurs personnels en vue de réaliser le couplage des enregistrements. Ce couplage peut être décrit de façon générale comme une méthode de traitement ou de transformation des identificateurs personnels tirés des dossiers personnels enregistrés dans l'une ou plusieurs bases de données opérationnelles afin de jumeler les identificateurs et de créer un dossier composé sur un particulier. Le couplage des enregistrements ne vise pas seulement à identifier les particuliers à des fins opérationnelles, mais à établir les concordances probabilistes de degrés de fiabilité variés à des fins de rapports statistiques. Les techniques utilisées dans le cadre du couplage d'enregistrements peuvent également servir dans les enquêtes afin d'en restreindre le champ dans les bases de données, lorsque des renseignements sur les identificateurs personnels existent.
Date de diffusion : 2000-12-05

Comment utiliser les filtres et le champ de recherche

Vous pouvez faire une recherche en inscrivant des mots-clés ou en sélectionnant des filtres (p. ex. sous Sujet, Géographie, etc.) du côté gauche de la page.
On peut utiliser les filtres ensemble ou former diverses combinaisons. À chaque sélection de filtre, la page des résultats est mise à jour.
Pour commencer une nouvelle recherche, cliquez sur le bouton Effacer tout au-dessus du champ de recherche ou décochez tous les filtres.
Les mots-clés et les filtres précisés sont affichés au-dessus du champ de recherche. Vous pouvez désélectionner l’un ou l’autre des éléments ou tous les éléments, pour préciser ou effacer votre recherche.

Comment préciser ma recherche

Vous pouvez entrer des mots-clés dans le champ de recherche. Il n’est pas nécessaire d’utiliser « + » ou « , » ou « ET ».
Vous pouvez supprimer certains mots-clés ou tous les mots-clés de votre chaîne de recherche.
Les mots-clés entre guillemets limitent la recherche à l’expression précise.
- Par exemple, si vous cherchez « Enquête sur la population active », vous obtiendrez seulement des documents contenant cette suite de mots.
Utilisez « ou » entre les mots-clés pour obtenir des résultats qui contiennent au moins l’un des termes recherchés.
- Par exemple, si vous cherchez enquête ou population ou active, vous obtiendrez seulement les documents contenant l’un ou l’autre de ces mots, ou tous ces mots.

Comment fonctionne la recherche

Cette forme de recherche fournira les résultats contenant le(s) mot(s) inscrit(s) dans le titre, la description, le sujet, la géographie, le numéro de produit ou toute autre information au sujet du produit.
- Par exemple, lorsque vous cherchez le mot « maladies », tous les résultats obtenus contiendront ce mot dans le titre, la description, ou le sujet.
La recherche ne se fait pas dans le texte des articles ou des publications. Pour faire une recherche plein texte dans les articles, utilisez la fonction de recherche du site.

Date de modification :: 2026-05-16

Sélection de la langue

WxT Language switcher

Recherche et menus

WxT Search form

Techniques statistiques

Filtrer les résultats par

Mot(s)-clé(s)

Type

Géographie

Enquête ou programme statistique

Contenu

Résultats

Tout (207) (0 to 10 of 207 results)

Données (1) ((1 result))

Analyses (199) (0 to 10 of 199 results)

Références (7) ((7 results))

Techniques statistiques

Filtrer les résultats par

Mot(s)-clé(s)

Type

Géographie

Enquête ou programme statistique

Contenu

Résultats

Tout (207) (0 to 10 of 207 results)

Données (1) ((1 result))

Analyses (199) (0 to 10 of 199 results)

Références (7) ((7 results))

De quelle façon les résultats seront-ils présentés?

De quelle façon les résultats seront-ils présentés?

Comment utiliser les filtres et le champ de recherche

Comment préciser ma recherche

Comment fonctionne la recherche