Techniques statistiques
Filtrer les résultats par
Search HelpMot(s)-clé(s)
Type
Géographie
Enquête ou programme statistique
- Enquête sur la population active (7)
- Recensement de la population (5)
- Enquête sur la santé dans les collectivités canadiennes - Composante annuelle (4)
- Enquête canadienne sur le revenu (4)
- Enquête sur les dépenses des ménages (3)
- Produit intérieur brut par industrie - National (mensuel) (2)
- Enquête mensuelle sur le transport par oléoduc de pétrole brut et autres produits pétroliers liquides (2)
- Statistique de l'état civil - Base de données sur les décès (2)
- Programme de déclaration uniforme de la criminalité (2)
- Enquête sur les ménages et l'environnement (2)
- Estimations annuelles du revenu des familles de recensement et des particuliers (Fichier des familles T1) (2)
- Enquête biennale sur les usines de traitement de l'eau potable (2)
- Enquête sur l'industrie de la gestion des déchets: secteur des administrations publiques (1)
- Comptes du bilan national (1)
- Comptes nationaux du produit intérieur brut en termes de revenus et de dépenses (1)
- Enquête biennale sur la gestion des déchets (1)
- Enquête mensuelle sur l'approvisionnement et l'écoulement de l'électricité (1)
- Enquête annuelle sur l'approvisionnement et l'écoulement de l'électricité (1)
- Indice des prix à la consommation (1)
- Enquête mensuelle sur les ventes de véhicules automobiles neufs (1)
- Enquête sur l'emploi, la rémunération et les heures de travail (1)
- Enquête sur la sécurité financière (1)
- Enquête mensuelle sur le transport de passagers par autobus et le transport urbain (1)
- Stock et consommation de capital fixe non résidentiel (1)
- Frais de scolarité et de subsistance (1)
- Registre canadien du cancer (1)
- Statistique de l'état civil - Base de données sur les naissances (1)
- Recensement de l'agriculture (1)
- Estimations démographiques annuelles: Canada, provinces et territoires (1)
- Banque de données administratives longitudinales (1)
- Enquête annuelle sur la recherche et le développement dans l'industrie canadienne (1)
- Recherche et développement des organismes privés sans but lucratif au Canada (1)
- Enquête auprès des jeunes en transition (1)
- Enquête sur l'emploi du temps (1)
- Enquête sociale générale - Identité sociale (1)
- Enquête canadienne sur les mesures de la santé (1)
- Système de comptabilité économique et environnementale du Canada - Comptes des flux physiques (1)
- Statistiques de finances publiques (1)
- Estimations des dépenses canadiennes au titre de recherche et développement (1)
- Enquête nationale canadienne sur la santé (1)
- Enquête sur la sécurité dans les espaces publics et privés (1)
- Étude sur les transferts de fonds internationaux (1)
- Enquête canadienne sur le logement (1)
- Enquête sur les modes d'apprentissage et de garde des jeunes enfants (EMAGJE) (1)
- Série d'enquêtes sur les perspectives canadiennes (SEPC) (1)
- Indicateurs sur le marché du travail (1)
- Banque du Canada (1)
- Programme d'analyse longitudinale de l'emploi (1)
Résultats
Tout (204)
Tout (204) (0 to 10 of 204 results)
- Revues et périodiques : 11-633-XDescription : Les documents de cette série traitent des méthodes utilisées pour produire des données qui seront employées pour effectuer des études analytiques à Statistique Canada sur l’économie, la santé et la société. Ils ont pour but de renseigner les lecteurs sur les méthodes statistiques, les normes et les définitions utilisées pour élaborer des bases de données à des fins de recherche. Tous les documents de la série ont fait l’objet d’un examen par les pairs et d’une révision institutionnelle, afin de veiller à ce qu’ils soient conformes au mandat de Statistique Canada et qu’ils respectent les normes généralement reconnues régissant les bonnes pratiques professionnelles.Date de diffusion : 2025-12-08
- Articles et rapports : 18-001-X2025001Description : Cet article porte l’analyse des grappes d’entreprises à une échelle géographique plus granulaire en développant une méthodologie d’identification des grappes d’entreprises à l’échelle du quartier. La méthode proposée identifie les grappes d’entreprises au niveau des, qui est l’une des unités spatiales d’analyse les plus granulaires définies par Statistique Canada. La méthode est mise au point et appliquée à quatre régions métropolitaines de recensement (RMR) de tailles différentes et pour différentes spécifications de grappes industrielles, y compris les groupes simples à 2 chiffres du Système de classification des industries de l’Amérique du Nord (SCIAN) ainsi que les grappes d’industries résultant de regroupements de codes SCIAN, tels que définis par Delgado et coll. (2014).Date de diffusion : 2025-10-10
- Articles et rapports : 11-522-X202500100019Description : Le couplage d'enregistrements exact et efficace s'avère crucial pour veiller à ce que le Registre statistique des entreprises (RSE) de Statistique Canada soit exhaustif et actuel. Le couplage de listes externes d'entreprises au RSE selon le nom présente des défis sur le plan méthodologique et des calculs, surtout au fur et à mesure que les volumes de données augmentent. Le présent article décrit une méthodologie évolutive qui se fonde sur des techniques d'établissement de blocs pour limiter l'espace de recherche informatique, et intègre de multiples mesures de similarité, des distances d'édition et du chevauchement de n-grammes aux méthodes fondées sur la vectorisation utilisant Sentence-BERT (SBERT), afin de déceler les paires appariées probables. En jumelant des comparaisons simples au niveau des caractères à des méthodes de vectorisation sémantique plus avancées, l'approche peut s'adapter à diverses conventions nominales et différents degrés de complexité. Même si cela ne garantit pas une précision supérieure dans toutes les situations, cette méthode offre un équilibre pragmatique entre la faisabilité des calculs et la qualité du couplage.Date de diffusion : 2025-09-08
- Articles et rapports : 11-522-X202500100020Description : Au sein de Statistique Canada, de nombreux ensembles de données sont appariés à l'aide de quasi-identificateurs, comme le prénom, le nom de famille ou l'adresse. En pareil cas, les erreurs de couplage peuvent être une préoccupation et doivent donc être mesurées. À cet égard, des études menées antérieurement ont révélé que cette évaluation peut s'appuyer sur la modélisation du nombre de liens d'un enregistrement donné, tout en tenant compte de toutes les interactions qui existent entre les variables de couplage et en se passant de vérifications manuelles, aussi longtemps que la décision de lier deux enregistrements ne fait pas intervenir d'autres enregistrements. Dans le cadre de la présente communication, la méthodologie utilisée est adaptée à une catégorie de stratégies pratiques, lesquelles ne respectent pas cette contrainte en liant les enregistrements par vagues successives, où une vague donnée lie un sous-ensemble d'enregistrements qui ne sont pas liés dans les vagues précédentes. En particulier, le couplage peut être fondé sur une vague déterministe suivie d'une vague probabiliste.Date de diffusion : 2025-09-08
- 5. Sélection de seuils basée sur le modèle pour effectuer des couplages dans le domaine agricole ArchivéArticles et rapports : 11-522-X202500100021Description : La sélection optimale de seuils représente un défi crucial au chapitre du couplage probabiliste, ayant d'importantes répercussions sur l'exactitude et la fiabilité des ensembles de données couplés. Le présent document analyse le rendement du modèle de voisinage, un modèle d'erreur récemment proposé qui modélise des erreurs de couplage en fonction du nombre de couplages de chaque enregistrement. On a évalué trois algorithmes de sélection des seuils à l'aide du modèle de voisinage, mettant en évidence les formes et les limites de chacun. On a analysé leur rendement à l'aide d'études de simulation, qui ont montré que les méthodes utilisant le modèle de voisinage ont obtenu un biais relatif inférieur par rapport à deux méthodes établies pour la sélection des seuils. En outre, l'utilité pratique a été validée par des tests d'adéquation réalisés sur quatre ensembles de données agricoles, ce qui montre que le modèle peut être utilisé dans des applications de la vie réelle.Date de diffusion : 2025-09-08
- Articles et rapports : 11-522-X202500100022Description : Au Canada, le formulaire d'impôt T1 est utilisé pour la déclaration du revenu personnel, qu'il ait été gagné en tant que personne employée ou travailleur autonome. Le revenu provenant d'un travail autonome, ou « revenu d'entreprise T1 », est déclaré par des entreprises détenues par une seule personne ou en partenariat. Un partenariat T1 comprend deux entités juridiques ou plus qui font une déclaration conjointe pour une entreprise partagée. Les données d'entreprises T1 sont reçues sous forme de déclarations individuelles; ce qui signifie que les données pour les partenariats sont reçues séparément pour chaque partenaire. Le couplage d'enregistrements interne dans la base de données T1 sur les entreprises est effectué pour identifier les partenariats et prévenir le surdénombrement dans la population finale des entreprises T1. Ce nouveau processus d'identification des partenariats T1 tire parti de nouveaux algorithmes, comme le groupement numérique DBSCAN par appariement flou, pour déterminer les couplages internes. La théorie des graphes est utilisée pour bâtir la liste des partenariats à partir des paires de rangées relevées dans le processus de couplage.Date de diffusion : 2025-09-08
- Articles et rapports : 11-522-X202500100023Description : La plus récente Cohorte santé et environnement du recensement canadien (CSERCan) s'inscrit dans une série de couplages de microdonnées fondés sur la population qui appuient la recherche en santé de la population selon certaines caractéristiques démographiques, sociales et économiques. La CSERCan de 2021 contient 95,5 % des enregistrements de de l'échantillon du questionnaire détaillé du Recensement de 2021. Les enregistrements ne pouvant pas être couplés aux données du Dépôt d'enregistrements dérivés (DED) et ceux présumés être des doublons représentent les 4,5 % restants. Les poids principaux et les poids de répliques rajustés en fonction du couplage permettent aux chercheurs d'estimer et d'évaluer la variance des mesures agrégées de la santé de la population en présence d'appariements manquants, afin de mieux comprendre les expériences des différents groupes de population.Date de diffusion : 2025-09-08
- Articles et rapports : 11-522-X202500100027Description : Dans le présent article, plusieurs défis rencontrés lors de l'établissement des estimations de la population américaine d'après les dossiers administratifs (DA) en 2020 sont identifiés. Parmi ces enjeux, mentionnons l'exactitude au niveau de l'emplacement, la couverture des personnes et la cohérence dans le temps, le filtrage des non-résidents et des personnes décédées à la date de référence, le dévoilement des couplages manquants entre les enregistrements de personnes et d'adresses et la prévision des caractéristiques démographiques. Plusieurs façons d'aborder ces questions sont examinées. Les résultats des régressions illustrent la façon dont les défis et les solutions ont une incidence sur les estimations de la population des comtés basées sur les DA.Date de diffusion : 2025-09-08
- Articles et rapports : 12-001-X202500100004Description : La collecte de données d’enquête est souvent limitée par une non-réponse totale ou partielle. Pour réduire la dépendance à des hypothèses robustes relatives aux mécanismes d’absence de données, les statisticiens peuvent utiliser des renseignements sur les distributions marginales de population connues, par exemple, découlant de recensements ou de bases de données administratives. Une approche en ce sens est le recours au cadre de données manquantes avec marges auxiliaires, qui repose sur l’imputation multiple à la fois pour la non-réponse totale et la non-réponse partielle, de sorte que les estimations pondérées par les poids d’enquête correspondent aux distributions marginales connues. Toutefois, ce cadre repose sur la spécification et l’estimation d’une distribution conjointe pour les indicateurs de données d’enquête et de non-réponse, ce qui peut présenter des défis du point de vue du calcul et de la pratique pour des données comportant de nombreuses variables de divers types. Nous proposons deux adaptations du cadre de données manquantes avec marges auxiliaires afin de simplifier la tâche d’imputation. Tout d’abord, plutôt que de préciser un modèle conjoint pour les données des unités répondantes, nous avons recours à une imputation hot deck aléatoire tout en utilisant toujours les distributions marginales connues. Ensuite, plutôt qu’un échantillonnage à partir de distributions conditionnelles découlant du modèle conjoint pour les données manquantes dues à une non-réponse partielle, nous appliquons une imputation multiple par équations en séries pour la non-réponse partielle avant une imputation pour la non-réponse totale. À l’aide d’études par simulations avec des mécanismes de données manquantes non ignorables, nous démontrons que la démarche proposée peut fournir des estimations ponctuelles et par intervalle plus exactes que des modèles ne tirant pas profit de l’information auxiliaire. Nous illustrons cette démarche à l’aide de données relatives à la participation électorale tirée de la Current Population Survey des États-Unis.Date de diffusion : 2025-06-30
- Articles et rapports : 12-001-X202500100013Description : Cette discussion de l’article de Rao et Lohr se concentre sur l’utilisation de procédures d’apprentissage automatique pour estimer les paramètres d’une population finie. Bien que ces méthodes suscitent un intérêt croissant au sein des instituts nationaux de statistique, plusieurs domaines restent largement inexplorés et devront recevoir une attention particulière dans les années à venir. Dans cette discussion, je souligne les sujets potentiels pour des travaux de recherche et développement futurs dans ce domaine en évolution rapide.Date de diffusion : 2025-06-30
- Précédent Go to previous page of Tout results
- 1 (actuel) Go to page 1 of Tout results
- 2 Go to page 2 of Tout results
- 3 Go to page 3 of Tout results
- 4 Go to page 4 of Tout results
- 5 Go to page 5 of Tout results
- 6 Go to page 6 of Tout results
- 7 Go to page 7 of Tout results
- ...
- 21 Go to page 21 of Tout results
- Suivant Go to next page of Tout results
Données (1)
Données (1) ((1 result))
- Tableau : 11-10-0074-01Géographie : Secteur de recensementLa fréquence : OccasionnelleDescription :
L'indice de divergence (indice-D) est une mesure de la diversité des niveaux de revenus des familles composant les quartiers. Il compare les répartitions discrètes des revenus de quartiers (secteurs de recensement ou SR) à une répartition de base, soit les quintiles de revenu de la région métropolitaine de recensement (RMR) du quartier.
Date de diffusion : 2020-06-22
Analyses (196)
Analyses (196) (0 to 10 of 196 results)
- Revues et périodiques : 11-633-XDescription : Les documents de cette série traitent des méthodes utilisées pour produire des données qui seront employées pour effectuer des études analytiques à Statistique Canada sur l’économie, la santé et la société. Ils ont pour but de renseigner les lecteurs sur les méthodes statistiques, les normes et les définitions utilisées pour élaborer des bases de données à des fins de recherche. Tous les documents de la série ont fait l’objet d’un examen par les pairs et d’une révision institutionnelle, afin de veiller à ce qu’ils soient conformes au mandat de Statistique Canada et qu’ils respectent les normes généralement reconnues régissant les bonnes pratiques professionnelles.Date de diffusion : 2025-12-08
- Articles et rapports : 18-001-X2025001Description : Cet article porte l’analyse des grappes d’entreprises à une échelle géographique plus granulaire en développant une méthodologie d’identification des grappes d’entreprises à l’échelle du quartier. La méthode proposée identifie les grappes d’entreprises au niveau des, qui est l’une des unités spatiales d’analyse les plus granulaires définies par Statistique Canada. La méthode est mise au point et appliquée à quatre régions métropolitaines de recensement (RMR) de tailles différentes et pour différentes spécifications de grappes industrielles, y compris les groupes simples à 2 chiffres du Système de classification des industries de l’Amérique du Nord (SCIAN) ainsi que les grappes d’industries résultant de regroupements de codes SCIAN, tels que définis par Delgado et coll. (2014).Date de diffusion : 2025-10-10
- Articles et rapports : 11-522-X202500100019Description : Le couplage d'enregistrements exact et efficace s'avère crucial pour veiller à ce que le Registre statistique des entreprises (RSE) de Statistique Canada soit exhaustif et actuel. Le couplage de listes externes d'entreprises au RSE selon le nom présente des défis sur le plan méthodologique et des calculs, surtout au fur et à mesure que les volumes de données augmentent. Le présent article décrit une méthodologie évolutive qui se fonde sur des techniques d'établissement de blocs pour limiter l'espace de recherche informatique, et intègre de multiples mesures de similarité, des distances d'édition et du chevauchement de n-grammes aux méthodes fondées sur la vectorisation utilisant Sentence-BERT (SBERT), afin de déceler les paires appariées probables. En jumelant des comparaisons simples au niveau des caractères à des méthodes de vectorisation sémantique plus avancées, l'approche peut s'adapter à diverses conventions nominales et différents degrés de complexité. Même si cela ne garantit pas une précision supérieure dans toutes les situations, cette méthode offre un équilibre pragmatique entre la faisabilité des calculs et la qualité du couplage.Date de diffusion : 2025-09-08
- Articles et rapports : 11-522-X202500100020Description : Au sein de Statistique Canada, de nombreux ensembles de données sont appariés à l'aide de quasi-identificateurs, comme le prénom, le nom de famille ou l'adresse. En pareil cas, les erreurs de couplage peuvent être une préoccupation et doivent donc être mesurées. À cet égard, des études menées antérieurement ont révélé que cette évaluation peut s'appuyer sur la modélisation du nombre de liens d'un enregistrement donné, tout en tenant compte de toutes les interactions qui existent entre les variables de couplage et en se passant de vérifications manuelles, aussi longtemps que la décision de lier deux enregistrements ne fait pas intervenir d'autres enregistrements. Dans le cadre de la présente communication, la méthodologie utilisée est adaptée à une catégorie de stratégies pratiques, lesquelles ne respectent pas cette contrainte en liant les enregistrements par vagues successives, où une vague donnée lie un sous-ensemble d'enregistrements qui ne sont pas liés dans les vagues précédentes. En particulier, le couplage peut être fondé sur une vague déterministe suivie d'une vague probabiliste.Date de diffusion : 2025-09-08
- 5. Sélection de seuils basée sur le modèle pour effectuer des couplages dans le domaine agricole ArchivéArticles et rapports : 11-522-X202500100021Description : La sélection optimale de seuils représente un défi crucial au chapitre du couplage probabiliste, ayant d'importantes répercussions sur l'exactitude et la fiabilité des ensembles de données couplés. Le présent document analyse le rendement du modèle de voisinage, un modèle d'erreur récemment proposé qui modélise des erreurs de couplage en fonction du nombre de couplages de chaque enregistrement. On a évalué trois algorithmes de sélection des seuils à l'aide du modèle de voisinage, mettant en évidence les formes et les limites de chacun. On a analysé leur rendement à l'aide d'études de simulation, qui ont montré que les méthodes utilisant le modèle de voisinage ont obtenu un biais relatif inférieur par rapport à deux méthodes établies pour la sélection des seuils. En outre, l'utilité pratique a été validée par des tests d'adéquation réalisés sur quatre ensembles de données agricoles, ce qui montre que le modèle peut être utilisé dans des applications de la vie réelle.Date de diffusion : 2025-09-08
- Articles et rapports : 11-522-X202500100022Description : Au Canada, le formulaire d'impôt T1 est utilisé pour la déclaration du revenu personnel, qu'il ait été gagné en tant que personne employée ou travailleur autonome. Le revenu provenant d'un travail autonome, ou « revenu d'entreprise T1 », est déclaré par des entreprises détenues par une seule personne ou en partenariat. Un partenariat T1 comprend deux entités juridiques ou plus qui font une déclaration conjointe pour une entreprise partagée. Les données d'entreprises T1 sont reçues sous forme de déclarations individuelles; ce qui signifie que les données pour les partenariats sont reçues séparément pour chaque partenaire. Le couplage d'enregistrements interne dans la base de données T1 sur les entreprises est effectué pour identifier les partenariats et prévenir le surdénombrement dans la population finale des entreprises T1. Ce nouveau processus d'identification des partenariats T1 tire parti de nouveaux algorithmes, comme le groupement numérique DBSCAN par appariement flou, pour déterminer les couplages internes. La théorie des graphes est utilisée pour bâtir la liste des partenariats à partir des paires de rangées relevées dans le processus de couplage.Date de diffusion : 2025-09-08
- Articles et rapports : 11-522-X202500100023Description : La plus récente Cohorte santé et environnement du recensement canadien (CSERCan) s'inscrit dans une série de couplages de microdonnées fondés sur la population qui appuient la recherche en santé de la population selon certaines caractéristiques démographiques, sociales et économiques. La CSERCan de 2021 contient 95,5 % des enregistrements de de l'échantillon du questionnaire détaillé du Recensement de 2021. Les enregistrements ne pouvant pas être couplés aux données du Dépôt d'enregistrements dérivés (DED) et ceux présumés être des doublons représentent les 4,5 % restants. Les poids principaux et les poids de répliques rajustés en fonction du couplage permettent aux chercheurs d'estimer et d'évaluer la variance des mesures agrégées de la santé de la population en présence d'appariements manquants, afin de mieux comprendre les expériences des différents groupes de population.Date de diffusion : 2025-09-08
- Articles et rapports : 11-522-X202500100027Description : Dans le présent article, plusieurs défis rencontrés lors de l'établissement des estimations de la population américaine d'après les dossiers administratifs (DA) en 2020 sont identifiés. Parmi ces enjeux, mentionnons l'exactitude au niveau de l'emplacement, la couverture des personnes et la cohérence dans le temps, le filtrage des non-résidents et des personnes décédées à la date de référence, le dévoilement des couplages manquants entre les enregistrements de personnes et d'adresses et la prévision des caractéristiques démographiques. Plusieurs façons d'aborder ces questions sont examinées. Les résultats des régressions illustrent la façon dont les défis et les solutions ont une incidence sur les estimations de la population des comtés basées sur les DA.Date de diffusion : 2025-09-08
- Articles et rapports : 12-001-X202500100004Description : La collecte de données d’enquête est souvent limitée par une non-réponse totale ou partielle. Pour réduire la dépendance à des hypothèses robustes relatives aux mécanismes d’absence de données, les statisticiens peuvent utiliser des renseignements sur les distributions marginales de population connues, par exemple, découlant de recensements ou de bases de données administratives. Une approche en ce sens est le recours au cadre de données manquantes avec marges auxiliaires, qui repose sur l’imputation multiple à la fois pour la non-réponse totale et la non-réponse partielle, de sorte que les estimations pondérées par les poids d’enquête correspondent aux distributions marginales connues. Toutefois, ce cadre repose sur la spécification et l’estimation d’une distribution conjointe pour les indicateurs de données d’enquête et de non-réponse, ce qui peut présenter des défis du point de vue du calcul et de la pratique pour des données comportant de nombreuses variables de divers types. Nous proposons deux adaptations du cadre de données manquantes avec marges auxiliaires afin de simplifier la tâche d’imputation. Tout d’abord, plutôt que de préciser un modèle conjoint pour les données des unités répondantes, nous avons recours à une imputation hot deck aléatoire tout en utilisant toujours les distributions marginales connues. Ensuite, plutôt qu’un échantillonnage à partir de distributions conditionnelles découlant du modèle conjoint pour les données manquantes dues à une non-réponse partielle, nous appliquons une imputation multiple par équations en séries pour la non-réponse partielle avant une imputation pour la non-réponse totale. À l’aide d’études par simulations avec des mécanismes de données manquantes non ignorables, nous démontrons que la démarche proposée peut fournir des estimations ponctuelles et par intervalle plus exactes que des modèles ne tirant pas profit de l’information auxiliaire. Nous illustrons cette démarche à l’aide de données relatives à la participation électorale tirée de la Current Population Survey des États-Unis.Date de diffusion : 2025-06-30
- Articles et rapports : 12-001-X202500100013Description : Cette discussion de l’article de Rao et Lohr se concentre sur l’utilisation de procédures d’apprentissage automatique pour estimer les paramètres d’une population finie. Bien que ces méthodes suscitent un intérêt croissant au sein des instituts nationaux de statistique, plusieurs domaines restent largement inexplorés et devront recevoir une attention particulière dans les années à venir. Dans cette discussion, je souligne les sujets potentiels pour des travaux de recherche et développement futurs dans ce domaine en évolution rapide.Date de diffusion : 2025-06-30
- Précédent Go to previous page of Analyses results
- 1 (actuel) Go to page 1 of Analyses results
- 2 Go to page 2 of Analyses results
- 3 Go to page 3 of Analyses results
- 4 Go to page 4 of Analyses results
- 5 Go to page 5 of Analyses results
- 6 Go to page 6 of Analyses results
- 7 Go to page 7 of Analyses results
- ...
- 20 Go to page 20 of Analyses results
- Suivant Go to next page of Analyses results
Références (7)
Références (7) ((7 results))
- Enquêtes et programmes statistiques — Documentation : 84-538-XGéographie : CanadaDescription : Cette publication électronique présente la méthodologie sous-jacente à la production des tables de mortalité pour le Canada, les provinces et les territoires.Date de diffusion : 2023-08-28
- Enquêtes et programmes statistiques — Documentation : 82-225-X200701010508Description :
Aperçu du couplage des enregistrements décrit le processus utilisé dans le module de couplage des enregistrements du registre canadien du cancer. On y trouve les étapes suivantes : préparatifs avant le couplage ; pré-traitement ; couplage ; post-traitement ; analyse des groupes et choix d'une solution ; entrée des solutions ; et, traitement des solutions.
Date de diffusion : 2008-01-18 - Enquêtes et programmes statistiques — Documentation : 11-522-X20050019476Description :
La communication montrera comment, avec les données publiées par Statistique Canada et disponibles à partir des bibliothèques membres de la CRÉPUQ, une approche d'appariement via le code postal permet de relier les données du fichier des résultats à un ensemble de variables contextuelles. Ces variables pourraient ainsi concourir à la production, à titre exploratoire, d'un indice servant à une meilleure explication de la performance différenciée des élèves des écoles. Sous l'angle des retombées, l'indice envisagé pourrait illustrer encore davantage les limites des classements d'élèves et d'écoles qui ne prennent pas suffisamment en compte ces informations.
Date de diffusion : 2007-03-02 - Enquêtes et programmes statistiques — Documentation : 68-514-XDescription :
L'approche utilisée par Statistique Canada pour la collecte et la diffusion de données économiques a évolué depuis plusieurs décennies vers un système de collecte et d'estimation fortement intégré qui alimente le cadre du Système de comptabilité nationale du Canada.
L'élément clé de cette approche a été la création de l'Enquête unifiée auprès des entreprises, qui avait pour objet d'améliorer l'uniformité, la cohérence, l'ampleur et la profondeur des données des enquêtes-entreprises.
L'EUE a atteint cet objectif en regroupant dans un cadre commun un grand nombre d'enquêtes-entreprises annuelles du Canada. Ce cadre comprenait une seule base de sondage, un schéma pour le plan d'échantillonnage, l'harmonisation conceptuelle du contenu des enquêtes, divers moyens d'utiliser les données administratives pertinentes, une collecte intégrée des données, des outils de traitement et d'analyse, et un entrepôt central de données.
Date de diffusion : 2006-11-20 - Enquêtes et programmes statistiques — Documentation : 89-612-XDescription :
Ce rapport comprend une description de la structure et du couplage de deux bases de données : la Banque de données administratives longitudinales (DAL) et la Base de données longitudinales sur les immigrants (BDIM). La combinaison des deux produits offre un fichier couplé de données fiscales sur les immigrants ayant obtenu le droit d'établissement et leurs données caractéristiques sur l'immigration. Le rapport souligne la façon de combiner l'information, référé ici comme DAL_BDIM, améliore et complète les bases de données actuelles et distinctes. Dans ce rapport, on compare le fichier complet de la BDIM avec l'échantillon d'immigrants pour évaluer la représentativité du fichier de l'échantillon.
Date de diffusion : 2004-01-05 - Enquêtes et programmes statistiques — Documentation : 81-595-M2003005Géographie : CanadaDescription :
Dans ce document, on élabore des procédures techniques permettant aux ministères de l'Éducation d'établir un lien entre les tests provinciaux et les tests nationaux et internationaux afin de pouvoir comparer les normes et présenter les résultats selon une échelle commune.
Date de diffusion : 2003-05-29 - Enquêtes et programmes statistiques — Documentation : 85-602-XDescription :
L'objet du présent rapport est de faire le survol des méthodes et techniques existantes qui utilisent les identificateurs personnels en vue de réaliser le couplage des enregistrements. Ce couplage peut être décrit de façon générale comme une méthode de traitement ou de transformation des identificateurs personnels tirés des dossiers personnels enregistrés dans l'une ou plusieurs bases de données opérationnelles afin de jumeler les identificateurs et de créer un dossier composé sur un particulier. Le couplage des enregistrements ne vise pas seulement à identifier les particuliers à des fins opérationnelles, mais à établir les concordances probabilistes de degrés de fiabilité variés à des fins de rapports statistiques. Les techniques utilisées dans le cadre du couplage d'enregistrements peuvent également servir dans les enquêtes afin d'en restreindre le champ dans les bases de données, lorsque des renseignements sur les identificateurs personnels existent.
Date de diffusion : 2000-12-05