Techniques statistiques

Passer au filtres. Voir les résultats.

Filtrer les résultats par

Search Help
Currently selected filters that can be removed

Mot(s)-clé(s)

Géographie

3 facets displayed. 0 facets selected.

Enquête ou programme statistique

1 facets displayed. 0 facets selected.

Contenu

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (207)

Tout (207) (0 to 10 of 207 results)

  • Revues et périodiques : 11-633-X
    Description : Les documents de cette série traitent des méthodes utilisées pour produire des données qui seront employées pour effectuer des études analytiques à Statistique Canada sur l’économie, la santé et la société. Ils ont pour but de renseigner les lecteurs sur les méthodes statistiques, les normes et les définitions utilisées pour élaborer des bases de données à des fins de recherche. Tous les documents de la série ont fait l’objet d’un examen par les pairs et d’une révision institutionnelle, afin de veiller à ce qu’ils soient conformes au mandat de Statistique Canada et qu’ils respectent les normes généralement reconnues régissant les bonnes pratiques professionnelles.
    Date de diffusion : 2026-04-24

  • Articles et rapports : 12-001-X202500200001
    Description : Des modèles de régression à erreurs emboîtées sont couramment utilisés pour intégrer des variables auxiliaires propres aux unités afin d’améliorer les estimations sur petits domaines. En cas d’erreur de spécification relative à la structure de la moyenne du modèle, l’erreur quadratique moyenne de prédiction (EQMP) fondée sur le plan des meilleurs prédicteurs linéaires sans biais empiriques (MPLSBE) augmente généralement. La méthode de meilleure prédiction observée (MPO) a été proposée dans le but d’améliorer l’EQMP fondée sur le plan par rapport à la méthode MPLSBE. Dans la présente étude, nous menons des expériences de simulation de Monte Carlo pour comprendre l’effet d’erreurs de spécification de la structure de la moyenne sur différents estimateurs sur petits domaines. Nos résultats laissent entendre que la méthode MPO reposant sur des variables auxiliaires au niveau de l’unité ne fournit pas de meilleurs résultats que la méthode MPLSBE pour ce qui est de l’EQMP fondée sur le plan, sauf si le nombre de petits domaines m est extrêmement grand. À l’inverse, les rendements de la méthode MPO s’améliorent nettement lorsque des variables auxiliaires au niveau du domaine sont utilisées. La présente étude inclut à la fois des données analytiques et numériques pour illustrer ces observations; elle fournit en outre des renseignements pratiques pour faire face aux erreurs de spécification de modèle dans le contexte d’estimations sur petits domaines (EPD).
    Date de diffusion : 2025-12-23

  • Articles et rapports : 12-001-X202500200007
    Description : Les échantillons probabilistes sont considérés comme la référence pour recueillir des renseignements dans les études basées sur la population, mais l’on utilise fréquemment, dans la pratique, des échantillons non probabilistes en raison de leur faible coût, de leur commodité et de l’absence de base de sondage pour l’enquête. Les estimations naïves fondées sur des échantillons non probabilistes risquent, en l’absence d’ajustements, d’être trompeuses en raison d’un biais de sélection. Une approche valide d’intégration des données comprenant l’imputation massive, la pondération par le score de propension et le calage a récemment été utilisée pour améliorer la représentativité des échantillons non probabilistes. L’efficacité de l’approche d’imputation massive dépend des hypothèses sous-jacentes du modèle. Dans le présent article, nous proposons d’utiliser l’apprentissage profond pour l’imputation massive dans une combinaison d’échantillons probabilistes et non probabilistes et de le comparer à plusieurs approches modernes d’imputation massive basée sur l’apprentissage automatique, y compris la modélisation additive généralisée, l’arbre de régression, la forêt aléatoire et le renforcement extrême du gradient (XGBoosting). Dans l’étude par simulation, les approches basées sur l’apprentissage profond se sont révélées plus robustes et efficaces que d’autres approches d’imputation massive contre l’invalidation des hypothèses sous-jacentes du modèle dans les scénarios de non-linéarité.
    Date de diffusion : 2025-12-23

  • Articles et rapports : 12-001-X202500200008
    Description : Une estimation à partir de données d’enquête classique fondée sur le plan repose sur un plan de sondage adéquatement défini afin d’obtenir une inférence valable. Nous tenons compte des propriétés de l’estimation par régression en cas d’erreur de spécification du plan de sondage, dans lequel les probabilités d’inclusion nominale et réelle ne sont pas nécessairement les mêmes. Cette situation générale d’erreur de spécification d’un plan de sondage comporte beaucoup de défis dans le contexte moderne dans lequel sont réalisées les enquêtes. Dans ce contexte, une analyse asymptotique de l’estimateur par la régression, une expression du biais et une expression de la variance sont présentées. En outre, un estimateur de la variance convergent est obtenu et une expression qui estime le biais en partie ou en totalité est présentée. Cette dernière expression peut être utilisée en tant qu’indicateur de la présence d’un biais causé par l’erreur de spécification d’un spécialiste. Une étude par simulation est menée afin d’étayer la théorie exposée.
    Date de diffusion : 2025-12-23

  • Articles et rapports : 18-001-X2025001
    Description : Cet article porte l’analyse des grappes d’entreprises à une échelle géographique plus granulaire en développant une méthodologie d’identification des grappes d’entreprises à l’échelle du quartier. La méthode proposée identifie les grappes d’entreprises au niveau des, qui est l’une des unités spatiales d’analyse les plus granulaires définies par Statistique Canada. La méthode est mise au point et appliquée à quatre régions métropolitaines de recensement (RMR) de tailles différentes et pour différentes spécifications de grappes industrielles, y compris les groupes simples à 2 chiffres du Système de classification des industries de l’Amérique du Nord (SCIAN) ainsi que les grappes d’industries résultant de regroupements de codes SCIAN, tels que définis par Delgado et coll. (2014).
    Date de diffusion : 2025-10-10

  • Articles et rapports : 11-522-X202500100019
    Description : Le couplage d'enregistrements exact et efficace s'avère crucial pour veiller à ce que le Registre statistique des entreprises (RSE) de Statistique Canada soit exhaustif et actuel. Le couplage de listes externes d'entreprises au RSE selon le nom présente des défis sur le plan méthodologique et des calculs, surtout au fur et à mesure que les volumes de données augmentent. Le présent article décrit une méthodologie évolutive qui se fonde sur des techniques d'établissement de blocs pour limiter l'espace de recherche informatique, et intègre de multiples mesures de similarité, des distances d'édition et du chevauchement de n-grammes aux méthodes fondées sur la vectorisation utilisant Sentence-BERT (SBERT), afin de déceler les paires appariées probables. En jumelant des comparaisons simples au niveau des caractères à des méthodes de vectorisation sémantique plus avancées, l'approche peut s'adapter à diverses conventions nominales et différents degrés de complexité. Même si cela ne garantit pas une précision supérieure dans toutes les situations, cette méthode offre un équilibre pragmatique entre la faisabilité des calculs et la qualité du couplage.
    Date de diffusion : 2025-09-08

  • Articles et rapports : 11-522-X202500100020
    Description : Au sein de Statistique Canada, de nombreux ensembles de données sont appariés à l'aide de quasi-identificateurs, comme le prénom, le nom de famille ou l'adresse. En pareil cas, les erreurs de couplage peuvent être une préoccupation et doivent donc être mesurées. À cet égard, des études menées antérieurement ont révélé que cette évaluation peut s'appuyer sur la modélisation du nombre de liens d'un enregistrement donné, tout en tenant compte de toutes les interactions qui existent entre les variables de couplage et en se passant de vérifications manuelles, aussi longtemps que la décision de lier deux enregistrements ne fait pas intervenir d'autres enregistrements. Dans le cadre de la présente communication, la méthodologie utilisée est adaptée à une catégorie de stratégies pratiques, lesquelles ne respectent pas cette contrainte en liant les enregistrements par vagues successives, où une vague donnée lie un sous-ensemble d'enregistrements qui ne sont pas liés dans les vagues précédentes. En particulier, le couplage peut être fondé sur une vague déterministe suivie d'une vague probabiliste.
    Date de diffusion : 2025-09-08

  • Articles et rapports : 11-522-X202500100021
    Description : La sélection optimale de seuils représente un défi crucial au chapitre du couplage probabiliste, ayant d'importantes répercussions sur l'exactitude et la fiabilité des ensembles de données couplés. Le présent document analyse le rendement du modèle de voisinage, un modèle d'erreur récemment proposé qui modélise des erreurs de couplage en fonction du nombre de couplages de chaque enregistrement. On a évalué trois algorithmes de sélection des seuils à l'aide du modèle de voisinage, mettant en évidence les formes et les limites de chacun. On a analysé leur rendement à l'aide d'études de simulation, qui ont montré que les méthodes utilisant le modèle de voisinage ont obtenu un biais relatif inférieur par rapport à deux méthodes établies pour la sélection des seuils. En outre, l'utilité pratique a été validée par des tests d'adéquation réalisés sur quatre ensembles de données agricoles, ce qui montre que le modèle peut être utilisé dans des applications de la vie réelle.
    Date de diffusion : 2025-09-08

  • Articles et rapports : 11-522-X202500100022
    Description : Au Canada, le formulaire d'impôt T1 est utilisé pour la déclaration du revenu personnel, qu'il ait été gagné en tant que personne employée ou travailleur autonome. Le revenu provenant d'un travail autonome, ou « revenu d'entreprise T1 », est déclaré par des entreprises détenues par une seule personne ou en partenariat. Un partenariat T1 comprend deux entités juridiques ou plus qui font une déclaration conjointe pour une entreprise partagée. Les données d'entreprises T1 sont reçues sous forme de déclarations individuelles; ce qui signifie que les données pour les partenariats sont reçues séparément pour chaque partenaire. Le couplage d'enregistrements interne dans la base de données T1 sur les entreprises est effectué pour identifier les partenariats et prévenir le surdénombrement dans la population finale des entreprises T1. Ce nouveau processus d'identification des partenariats T1 tire parti de nouveaux algorithmes, comme le groupement numérique DBSCAN par appariement flou, pour déterminer les couplages internes. La théorie des graphes est utilisée pour bâtir la liste des partenariats à partir des paires de rangées relevées dans le processus de couplage.
    Date de diffusion : 2025-09-08

  • Articles et rapports : 11-522-X202500100023
    Description : La plus récente Cohorte santé et environnement du recensement canadien (CSERCan) s'inscrit dans une série de couplages de microdonnées fondés sur la population qui appuient la recherche en santé de la population selon certaines caractéristiques démographiques, sociales et économiques. La CSERCan de 2021 contient 95,5 % des enregistrements de de l'échantillon du questionnaire détaillé du Recensement de 2021. Les enregistrements ne pouvant pas être couplés aux données du Dépôt d'enregistrements dérivés (DED) et ceux présumés être des doublons représentent les 4,5 % restants. Les poids principaux et les poids de répliques rajustés en fonction du couplage permettent aux chercheurs d'estimer et d'évaluer la variance des mesures agrégées de la santé de la population en présence d'appariements manquants, afin de mieux comprendre les expériences des différents groupes de population.
    Date de diffusion : 2025-09-08
Données (1)

Données (1) ((1 result))

  • Tableau : 11-10-0074-01
    Géographie : Secteur de recensement
    La fréquence : Occasionnelle
    Description :

    L'indice de divergence (indice-D) est une mesure de la diversité des niveaux de revenus des familles composant les quartiers. Il compare les répartitions discrètes des revenus de quartiers (secteurs de recensement ou SR) à une répartition de base, soit les quintiles de revenu de la région métropolitaine de recensement (RMR) du quartier.

    Date de diffusion : 2020-06-22
Analyses (199)

Analyses (199) (0 to 10 of 199 results)

  • Revues et périodiques : 11-633-X
    Description : Les documents de cette série traitent des méthodes utilisées pour produire des données qui seront employées pour effectuer des études analytiques à Statistique Canada sur l’économie, la santé et la société. Ils ont pour but de renseigner les lecteurs sur les méthodes statistiques, les normes et les définitions utilisées pour élaborer des bases de données à des fins de recherche. Tous les documents de la série ont fait l’objet d’un examen par les pairs et d’une révision institutionnelle, afin de veiller à ce qu’ils soient conformes au mandat de Statistique Canada et qu’ils respectent les normes généralement reconnues régissant les bonnes pratiques professionnelles.
    Date de diffusion : 2026-04-24

  • Articles et rapports : 12-001-X202500200001
    Description : Des modèles de régression à erreurs emboîtées sont couramment utilisés pour intégrer des variables auxiliaires propres aux unités afin d’améliorer les estimations sur petits domaines. En cas d’erreur de spécification relative à la structure de la moyenne du modèle, l’erreur quadratique moyenne de prédiction (EQMP) fondée sur le plan des meilleurs prédicteurs linéaires sans biais empiriques (MPLSBE) augmente généralement. La méthode de meilleure prédiction observée (MPO) a été proposée dans le but d’améliorer l’EQMP fondée sur le plan par rapport à la méthode MPLSBE. Dans la présente étude, nous menons des expériences de simulation de Monte Carlo pour comprendre l’effet d’erreurs de spécification de la structure de la moyenne sur différents estimateurs sur petits domaines. Nos résultats laissent entendre que la méthode MPO reposant sur des variables auxiliaires au niveau de l’unité ne fournit pas de meilleurs résultats que la méthode MPLSBE pour ce qui est de l’EQMP fondée sur le plan, sauf si le nombre de petits domaines m est extrêmement grand. À l’inverse, les rendements de la méthode MPO s’améliorent nettement lorsque des variables auxiliaires au niveau du domaine sont utilisées. La présente étude inclut à la fois des données analytiques et numériques pour illustrer ces observations; elle fournit en outre des renseignements pratiques pour faire face aux erreurs de spécification de modèle dans le contexte d’estimations sur petits domaines (EPD).
    Date de diffusion : 2025-12-23

  • Articles et rapports : 12-001-X202500200007
    Description : Les échantillons probabilistes sont considérés comme la référence pour recueillir des renseignements dans les études basées sur la population, mais l’on utilise fréquemment, dans la pratique, des échantillons non probabilistes en raison de leur faible coût, de leur commodité et de l’absence de base de sondage pour l’enquête. Les estimations naïves fondées sur des échantillons non probabilistes risquent, en l’absence d’ajustements, d’être trompeuses en raison d’un biais de sélection. Une approche valide d’intégration des données comprenant l’imputation massive, la pondération par le score de propension et le calage a récemment été utilisée pour améliorer la représentativité des échantillons non probabilistes. L’efficacité de l’approche d’imputation massive dépend des hypothèses sous-jacentes du modèle. Dans le présent article, nous proposons d’utiliser l’apprentissage profond pour l’imputation massive dans une combinaison d’échantillons probabilistes et non probabilistes et de le comparer à plusieurs approches modernes d’imputation massive basée sur l’apprentissage automatique, y compris la modélisation additive généralisée, l’arbre de régression, la forêt aléatoire et le renforcement extrême du gradient (XGBoosting). Dans l’étude par simulation, les approches basées sur l’apprentissage profond se sont révélées plus robustes et efficaces que d’autres approches d’imputation massive contre l’invalidation des hypothèses sous-jacentes du modèle dans les scénarios de non-linéarité.
    Date de diffusion : 2025-12-23

  • Articles et rapports : 12-001-X202500200008
    Description : Une estimation à partir de données d’enquête classique fondée sur le plan repose sur un plan de sondage adéquatement défini afin d’obtenir une inférence valable. Nous tenons compte des propriétés de l’estimation par régression en cas d’erreur de spécification du plan de sondage, dans lequel les probabilités d’inclusion nominale et réelle ne sont pas nécessairement les mêmes. Cette situation générale d’erreur de spécification d’un plan de sondage comporte beaucoup de défis dans le contexte moderne dans lequel sont réalisées les enquêtes. Dans ce contexte, une analyse asymptotique de l’estimateur par la régression, une expression du biais et une expression de la variance sont présentées. En outre, un estimateur de la variance convergent est obtenu et une expression qui estime le biais en partie ou en totalité est présentée. Cette dernière expression peut être utilisée en tant qu’indicateur de la présence d’un biais causé par l’erreur de spécification d’un spécialiste. Une étude par simulation est menée afin d’étayer la théorie exposée.
    Date de diffusion : 2025-12-23

  • Articles et rapports : 18-001-X2025001
    Description : Cet article porte l’analyse des grappes d’entreprises à une échelle géographique plus granulaire en développant une méthodologie d’identification des grappes d’entreprises à l’échelle du quartier. La méthode proposée identifie les grappes d’entreprises au niveau des, qui est l’une des unités spatiales d’analyse les plus granulaires définies par Statistique Canada. La méthode est mise au point et appliquée à quatre régions métropolitaines de recensement (RMR) de tailles différentes et pour différentes spécifications de grappes industrielles, y compris les groupes simples à 2 chiffres du Système de classification des industries de l’Amérique du Nord (SCIAN) ainsi que les grappes d’industries résultant de regroupements de codes SCIAN, tels que définis par Delgado et coll. (2014).
    Date de diffusion : 2025-10-10

  • Articles et rapports : 11-522-X202500100019
    Description : Le couplage d'enregistrements exact et efficace s'avère crucial pour veiller à ce que le Registre statistique des entreprises (RSE) de Statistique Canada soit exhaustif et actuel. Le couplage de listes externes d'entreprises au RSE selon le nom présente des défis sur le plan méthodologique et des calculs, surtout au fur et à mesure que les volumes de données augmentent. Le présent article décrit une méthodologie évolutive qui se fonde sur des techniques d'établissement de blocs pour limiter l'espace de recherche informatique, et intègre de multiples mesures de similarité, des distances d'édition et du chevauchement de n-grammes aux méthodes fondées sur la vectorisation utilisant Sentence-BERT (SBERT), afin de déceler les paires appariées probables. En jumelant des comparaisons simples au niveau des caractères à des méthodes de vectorisation sémantique plus avancées, l'approche peut s'adapter à diverses conventions nominales et différents degrés de complexité. Même si cela ne garantit pas une précision supérieure dans toutes les situations, cette méthode offre un équilibre pragmatique entre la faisabilité des calculs et la qualité du couplage.
    Date de diffusion : 2025-09-08

  • Articles et rapports : 11-522-X202500100020
    Description : Au sein de Statistique Canada, de nombreux ensembles de données sont appariés à l'aide de quasi-identificateurs, comme le prénom, le nom de famille ou l'adresse. En pareil cas, les erreurs de couplage peuvent être une préoccupation et doivent donc être mesurées. À cet égard, des études menées antérieurement ont révélé que cette évaluation peut s'appuyer sur la modélisation du nombre de liens d'un enregistrement donné, tout en tenant compte de toutes les interactions qui existent entre les variables de couplage et en se passant de vérifications manuelles, aussi longtemps que la décision de lier deux enregistrements ne fait pas intervenir d'autres enregistrements. Dans le cadre de la présente communication, la méthodologie utilisée est adaptée à une catégorie de stratégies pratiques, lesquelles ne respectent pas cette contrainte en liant les enregistrements par vagues successives, où une vague donnée lie un sous-ensemble d'enregistrements qui ne sont pas liés dans les vagues précédentes. En particulier, le couplage peut être fondé sur une vague déterministe suivie d'une vague probabiliste.
    Date de diffusion : 2025-09-08

  • Articles et rapports : 11-522-X202500100021
    Description : La sélection optimale de seuils représente un défi crucial au chapitre du couplage probabiliste, ayant d'importantes répercussions sur l'exactitude et la fiabilité des ensembles de données couplés. Le présent document analyse le rendement du modèle de voisinage, un modèle d'erreur récemment proposé qui modélise des erreurs de couplage en fonction du nombre de couplages de chaque enregistrement. On a évalué trois algorithmes de sélection des seuils à l'aide du modèle de voisinage, mettant en évidence les formes et les limites de chacun. On a analysé leur rendement à l'aide d'études de simulation, qui ont montré que les méthodes utilisant le modèle de voisinage ont obtenu un biais relatif inférieur par rapport à deux méthodes établies pour la sélection des seuils. En outre, l'utilité pratique a été validée par des tests d'adéquation réalisés sur quatre ensembles de données agricoles, ce qui montre que le modèle peut être utilisé dans des applications de la vie réelle.
    Date de diffusion : 2025-09-08

  • Articles et rapports : 11-522-X202500100022
    Description : Au Canada, le formulaire d'impôt T1 est utilisé pour la déclaration du revenu personnel, qu'il ait été gagné en tant que personne employée ou travailleur autonome. Le revenu provenant d'un travail autonome, ou « revenu d'entreprise T1 », est déclaré par des entreprises détenues par une seule personne ou en partenariat. Un partenariat T1 comprend deux entités juridiques ou plus qui font une déclaration conjointe pour une entreprise partagée. Les données d'entreprises T1 sont reçues sous forme de déclarations individuelles; ce qui signifie que les données pour les partenariats sont reçues séparément pour chaque partenaire. Le couplage d'enregistrements interne dans la base de données T1 sur les entreprises est effectué pour identifier les partenariats et prévenir le surdénombrement dans la population finale des entreprises T1. Ce nouveau processus d'identification des partenariats T1 tire parti de nouveaux algorithmes, comme le groupement numérique DBSCAN par appariement flou, pour déterminer les couplages internes. La théorie des graphes est utilisée pour bâtir la liste des partenariats à partir des paires de rangées relevées dans le processus de couplage.
    Date de diffusion : 2025-09-08

  • Articles et rapports : 11-522-X202500100023
    Description : La plus récente Cohorte santé et environnement du recensement canadien (CSERCan) s'inscrit dans une série de couplages de microdonnées fondés sur la population qui appuient la recherche en santé de la population selon certaines caractéristiques démographiques, sociales et économiques. La CSERCan de 2021 contient 95,5 % des enregistrements de de l'échantillon du questionnaire détaillé du Recensement de 2021. Les enregistrements ne pouvant pas être couplés aux données du Dépôt d'enregistrements dérivés (DED) et ceux présumés être des doublons représentent les 4,5 % restants. Les poids principaux et les poids de répliques rajustés en fonction du couplage permettent aux chercheurs d'estimer et d'évaluer la variance des mesures agrégées de la santé de la population en présence d'appariements manquants, afin de mieux comprendre les expériences des différents groupes de population.
    Date de diffusion : 2025-09-08
Références (7)

Références (7) ((7 results))

  • Enquêtes et programmes statistiques — Documentation : 84-538-X
    Géographie : Canada
    Description : Cette publication électronique présente la méthodologie sous-jacente à la production des tables de mortalité pour le Canada, les provinces et les territoires.
    Date de diffusion : 2023-08-28

  • Enquêtes et programmes statistiques — Documentation : 82-225-X200701010508
    Description :

    Aperçu du couplage des enregistrements décrit le processus utilisé dans le module de couplage des enregistrements du registre canadien du cancer. On y trouve les étapes suivantes : préparatifs avant le couplage ; pré-traitement ; couplage ; post-traitement ; analyse des groupes et choix d'une solution ; entrée des solutions ; et, traitement des solutions.

    Date de diffusion : 2008-01-18

  • Enquêtes et programmes statistiques — Documentation : 11-522-X20050019476
    Description :

    La communication montrera comment, avec les données publiées par Statistique Canada et disponibles à partir des bibliothèques membres de la CRÉPUQ, une approche d'appariement via le code postal permet de relier les données du fichier des résultats à un ensemble de variables contextuelles. Ces variables pourraient ainsi concourir à la production, à titre exploratoire, d'un indice servant à une meilleure explication de la performance différenciée des élèves des écoles. Sous l'angle des retombées, l'indice envisagé pourrait illustrer encore davantage les limites des classements d'élèves et d'écoles qui ne prennent pas suffisamment en compte ces informations.

    Date de diffusion : 2007-03-02

  • Enquêtes et programmes statistiques — Documentation : 68-514-X
    Description :

    L'approche utilisée par Statistique Canada pour la collecte et la diffusion de données économiques a évolué depuis plusieurs décennies vers un système de collecte et d'estimation fortement intégré qui alimente le cadre du Système de comptabilité nationale du Canada.

    L'élément clé de cette approche a été la création de l'Enquête unifiée auprès des entreprises, qui avait pour objet d'améliorer l'uniformité, la cohérence, l'ampleur et la profondeur des données des enquêtes-entreprises.

    L'EUE a atteint cet objectif en regroupant dans un cadre commun un grand nombre d'enquêtes-entreprises annuelles du Canada. Ce cadre comprenait une seule base de sondage, un schéma pour le plan d'échantillonnage, l'harmonisation conceptuelle du contenu des enquêtes, divers moyens d'utiliser les données administratives pertinentes, une collecte intégrée des données, des outils de traitement et d'analyse, et un entrepôt central de données.

    Date de diffusion : 2006-11-20

  • Enquêtes et programmes statistiques — Documentation : 89-612-X
    Description :

    Ce rapport comprend une description de la structure et du couplage de deux bases de données : la Banque de données administratives longitudinales (DAL) et la Base de données longitudinales sur les immigrants (BDIM). La combinaison des deux produits offre un fichier couplé de données fiscales sur les immigrants ayant obtenu le droit d'établissement et leurs données caractéristiques sur l'immigration. Le rapport souligne la façon de combiner l'information, référé ici comme DAL_BDIM, améliore et complète les bases de données actuelles et distinctes. Dans ce rapport, on compare le fichier complet de la BDIM avec l'échantillon d'immigrants pour évaluer la représentativité du fichier de l'échantillon.

    Date de diffusion : 2004-01-05

  • Enquêtes et programmes statistiques — Documentation : 81-595-M2003005
    Géographie : Canada
    Description :

    Dans ce document, on élabore des procédures techniques permettant aux ministères de l'Éducation d'établir un lien entre les tests provinciaux et les tests nationaux et internationaux afin de pouvoir comparer les normes et présenter les résultats selon une échelle commune.

    Date de diffusion : 2003-05-29

  • Enquêtes et programmes statistiques — Documentation : 85-602-X
    Description :

    L'objet du présent rapport est de faire le survol des méthodes et techniques existantes qui utilisent les identificateurs personnels en vue de réaliser le couplage des enregistrements. Ce couplage peut être décrit de façon générale comme une méthode de traitement ou de transformation des identificateurs personnels tirés des dossiers personnels enregistrés dans l'une ou plusieurs bases de données opérationnelles afin de jumeler les identificateurs et de créer un dossier composé sur un particulier. Le couplage des enregistrements ne vise pas seulement à identifier les particuliers à des fins opérationnelles, mais à établir les concordances probabilistes de degrés de fiabilité variés à des fins de rapports statistiques. Les techniques utilisées dans le cadre du couplage d'enregistrements peuvent également servir dans les enquêtes afin d'en restreindre le champ dans les bases de données, lorsque des renseignements sur les identificateurs personnels existent.

    Date de diffusion : 2000-12-05