Données administratives

Aide à l'ordre
entrées

Résultats

Tout (121)

Tout (121) (0 à 10 de 121 résultats)

  • Articles et rapports : 11-522-X202200100012
    Description : Au Bureau central de la statistique des Pays-Bas (CBS), pour certains secteurs économiques, deux séries d’indices de chiffre d’affaires intra-annuels partiellement indépendantes sont disponibles : une série mensuelle fondée sur des données d’enquête et une série trimestrielle fondée sur les données de la taxe sur la valeur ajoutée pour les petites unités et sur des données d’enquête réutilisées pour les autres unités. Le CBS vise à étalonner la série mensuelle d’indices de chiffre d’affaires aux données trimestrielles du recensement à une fréquence trimestrielle. Pour l’heure, cela n’est pas réalisable, car les données fiscales ont une distribution trimestrielle différente, le chiffre d’affaires étant relativement grand au quatrième trimestre de l’année et plus faible au premier trimestre. Dans la présente étude, nous cherchons à décrire cette tendance trimestrielle présentant un écart au niveau micro. Nous avons élaboré auparavant un modèle de mélange utilisant des niveaux de chiffre d’affaires absolus pouvant expliquer en partie les distributions trimestrielles. Étant donné que les niveaux de chiffre d’affaires absolus diffèrent entre les deux séries, nous utilisons dans la présente étude un modèle fondé sur les niveaux de chiffre d’affaires trimestriels relatifs au cours d’une année.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 11-522-X202200100019
    Description : L’objet de cet article est de comparer les résultats de l’appariement des individus présents dans la source fiscale française avec ceux de l’Enquête Annuelle de Recensement (EAR) 2019, obtenus par différentes méthodes. Ceci afin de décider si le programme de Répertoires Statistiques d’Individus et de Logements (Résil) devra se doter d’un outil d’appariement probabiliste pour son moteur d’identification et d’appariement des sources administratives.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 75F0002M2024002
    Description : Ce document de discussion décrit les considérations relatives à l'application de la méthodologie de la mesure du panier de consommation (MPC) à une source de données purement administrative. Le document commence par exposer les raisons qui justifient l'utilisation de données administratives sur le revenu pour la production de statistiques de pauvreté à l’aide de la MPC. Il décrit ensuite une proposition pour la création d'échantillons annuels et certaines mises en garde relatives à la création de ces échantillons, suivies d'une brève analyse utilisant les échantillons proposés. Le document conclut sur les améliorations potentielles à apporter aux échantillons et donne l'occasion aux lecteurs de faire part de leurs commentaires.
    Date de diffusion : 2024-02-08

  • Stats en bref : 11-001-X202402237898
    Description : Communiqué publié dans Le Quotidien – Bulletin de diffusion officielle de Statistique Canada
    Date de diffusion : 2024-01-22

  • Articles et rapports : 11-633-X2024001
    Description : La base de données longitudinales sur l’immigration (BDIM) est une source importante et complète de données contribuant à mieux comprendre le comportement économique des immigrants. Il s’agit du seul ensemble annuel de données canadiennes permettant d’étudier les caractéristiques des immigrants au Canada au moment de leur admission ainsi que leur situation économique et leur mobilité régionale (interprovinciale) sur plus de 35 ans.
    Date de diffusion : 2024-01-22

  • Profil d'une communauté ou d'une région : 46-26-0002
    Description : Le Registre national des adresses (RNA) est une liste d’adresses commerciales et résidentielles au Canada qui sont extraites du Registre des immeubles de Statistique Canada et sont jugées non confidentielles.
    Date de diffusion : 2023-12-19

  • Articles et rapports : 11F0019M2023003
    Description : La présente étude combine des données d’enquête avec des données administratives, en vue d’examiner la correspondance entre les activités d’un emploi rémunéré et celles d’un travail autonome, déclarées dans chacune de ces sources de données par les mêmes particuliers. L’étude permet également d’examiner le rôle que joue le travail autonome en tant que source de revenu complémentaire pour les particuliers dont la principale activité autodéclarée sur le marché du travail est l’emploi salarié.
    Date de diffusion : 2023-06-06

  • Articles et rapports : 11-633-X2022009
    Description :

    La base de données longitudinales sur l’immigration (BDIM) est une source importante et complète de données contribuant à mieux comprendre le comportement économique des immigrants. Il s’agit du seul ensemble annuel de données canadiennes permettant d’étudier les caractéristiques des immigrants au Canada au moment de leur admission ainsi que leur situation économique et leur mobilité régionale (interprovinciale) sur plus de 35 ans.

    Ce rapport traitera des sources de données, des concepts et des variables de la BDIM, du couplage d’enregistrements, du traitement des données, de la diffusion, de l’évaluation des données et des indicateurs de qualité, de la comparabilité avec d’autres ensembles de données relatives à l’immigration ainsi que des analyses que permet la BDIM.

    Date de diffusion : 2022-12-05

  • Articles et rapports : 12-001-X202200100006
    Description :

    Au cours des deux dernières décennies, les taux de réponse aux enquêtes ont régulièrement diminué. Dans ce contexte, il est devenu de plus en plus important pour les organismes statistiques d’élaborer et d’utiliser des méthodes permettant de réduire les effets négatifs de la non-réponse sur l’exactitude des estimations découlant d’enquêtes. Le suivi des cas de non-réponse peut être un remède efficace, même s’il exige du temps et des ressources, pour pallier le biais de non-réponse. Nous avons mené une étude par simulations à l’aide de données réelles d’enquêtes-entreprises, afin de tenter de répondre à plusieurs questions relatives au suivi de la non-réponse. Par exemple, en supposant un budget fixe de suivi de la non-réponse, quelle est la meilleure façon de sélectionner les unités non répondantes auprès desquelles effectuer un suivi ? Quel effort devons-nous consacrer à un suivi répété des non-répondants jusqu’à la réception d’une réponse ? Les non-répondants devraient-ils tous faire l’objet d’un suivi ou seulement un échantillon d’entre eux ? Dans le cas d’un suivi d’un échantillon seulement, comment sélectionner ce dernier ? Nous avons comparé les biais relatifs Monte Carlo et les racines de l’erreur quadratique moyenne relative Monte Carlo pour différents plans de sondage du suivi, tailles d’échantillon et scénarios de non-réponse. Nous avons également déterminé une expression de la taille de l’échantillon de suivi minimale nécessaire pour dépenser le budget, en moyenne, et montré que cela maximise le taux de réponse espéré. Une principale conclusion de notre expérience de simulation est que cette taille d’échantillon semble également réduire approximativement le biais et l’erreur quadratique moyenne des estimations.

    Date de diffusion : 2022-06-21

  • Articles et rapports : 46-28-0001202200100001
    Description :

    Lorsqu'une enquête publie des statistiques accompagnées d'un indicateur de qualité, celui-ci est habituellement dérivé à partir de mesures fondées sur la théorie de l'échantillonnage. La production d'indicateurs de qualité représente un défi important lorsque les statistiques sont produites à l'aide de sources alternatives pour lesquelles aucun échantillonnage n'est fait. Ce document décrit une nouvelle méthode utilisée pour créer un indicateur de qualité qui combine des indicateurs obtenus à différentes étapes du traitement des données. Un exemple d'application de la méthode dans le cadre du Programme de la statistique du logement canadien est fourni en annexe.

    Date de diffusion : 2022-01-06
Données (1)

Données (1) ((1 résultat))

  • Profil d'une communauté ou d'une région : 46-26-0002
    Description : Le Registre national des adresses (RNA) est une liste d’adresses commerciales et résidentielles au Canada qui sont extraites du Registre des immeubles de Statistique Canada et sont jugées non confidentielles.
    Date de diffusion : 2023-12-19
Analyses (104)

Analyses (104) (50 à 60 de 104 résultats)

  • Articles et rapports : 11-522-X201300014268
    Description :

    En surveillance des maladies chroniques, la cueillette d’information est essentielle dans le but de mesurer l’ampleur des maladies, évaluer l’utilisation des services, identifier les groupes à risque et suivre l’évolution des maladies et des facteurs de risque dans le temps en vue de planifier et d’appliquer des programmes de prévention en santé publique. C’est dans ce contexte qu’a été créé le Système intégré de surveillance des maladies chroniques du Québec (SISMACQ). Le SISMACQ est une base de données issue du jumelage de fichiers administratifs, couvrant les années 1996 à 2013, représentant une alternative intéressante aux données d’enquêtes puisqu’elle porte sur la totalité de la population, n’est pas affectée par le biais de rappel et permet de suivre la population dans le temps et dans l’espace. Cette présentation a pour objet de présenter la pertinence de l’utilisation des données administratives comme alternative aux données d’enquête ainsi que de les méthodes choisies pour la construction de la cohorte populationnelle à partir du jumelage des différentes sources de données brutes ainsi que de décrire les traitements apportées dans le but de minimiser les biais. Nous discuterons également des avantages et des limites liés à l’analyse des fichiers administratifs.

    Date de diffusion : 2014-10-31

  • Articles et rapports : 11-522-X201300014271
    Description :

    Ce document vise à présenter l'utilisation des dossiers administratifs dans le U.S. Census pour les logements collectifs. Le dénombrement des logements collectifs signifie la collecte de données dans des endroits difficiles d'accès, comme les établissements correctionnels, les établissements de soins infirmiers spécialisés et les casernes militaires. Nous examinons les avantages et les contraites de l'utilisation de diverses sources de dossier administratifs pour l'élaboration de la base de sondage des logements collectifs, en vue d'améliorer la couverture. Le présent document est un document d'accompagnement de la communication de Chun et Gan (2014) portant sur les utilisations possibles des dossiers administratifs dans le recensement des logements collectifs.

    Date de diffusion : 2014-10-31

  • Articles et rapports : 11-522-X201300014272
    Description :

    Deux tendances convergentes soulèvent des questions concernant l’avenir des enquêtes probabilistes à grande échelle menées par ou pour des instituts nationaux de statistique (INS). Tout d’abord, l’augmentation des coûts et des taux de non-réponse menace potentiellement la rentabilité et la valeur inférentielle des enquêtes. En deuxième lieu, l’intérêt est de plus en plus grand à l’égard des mégadonnées en remplacement des enquêtes. Il existe de nombreux types différents de mégadonnées, mais je mettrai l’accent particulièrement sur les données produites par l’entremise des médias sociaux. Le présent document complète et met à jour un document antérieur sur le sujet (Couper, 2013). Je passerai en revue certaines des préoccupations concernant les mégadonnées, particulièrement dans la perspective des enquêtes. Je soutiens qu’il y a place pour des enquêtes de grande qualité et des analyses de mégadonnées dans les travaux des INS. Même s’il est peu probable que les mégadonnées remplacent les enquêtes de grande qualité, je crois que les deux méthodes peuvent remplir des fonctions complémentaires. Je tente de déterminer certains des critères qui doivent être satisfaits, ainsi que les questions auxquelles on doit répondre, avant que les mégadonnées puissent être utilisées pour des inférences fiables au niveau de la population.

    Date de diffusion : 2014-10-31

  • Articles et rapports : 11-522-X201300014273
    Description :

    De plus en plus de données sont produites au moyen du nombre croissant de dispositifs électroniques qui nous entourent et que l’on retrouve sur Internet. La grande quantité de données et la fréquence élevée à laquelle elles sont produites ont donné lieu à l’introduction du terme « mégadonnées ». Compte tenu du fait que ces données rendent compte de nombreux aspects différents de nos vies au quotidien, et en raison de leur abondance et de leur disponibilité, les sources de mégadonnées sont très intéressantes du point de vue des statistiques officielles. Toutefois, les premières expériences obtenues suite aux analyses de grandes quantités d’enregistrements de boucles de détection de véhicules au Pays-Bas, d’enregistrements des détails des appels de téléphones mobiles et de messages des médias sociaux aux Pays-Bas révèlent qu’un certain nombre de défis doivent être résolus pour permettre l’application de ces sources de données aux statistiques officielles. Ces défis, ainsi que les leçons apprises pendant les études initiales, seront traitées et illustrées au moyen d’exemples. De façon plus particulière, les sujets suivants sont abordés : les trois types généraux de mégadonnées définis, la nécessité d’accéder à des quantités importantes de données et de les analyser, la façon de traiter les données qui comportent du bruit et d’aborder la sélectivité (ainsi que notre propre biais concernant ce sujet), comment aller au-delà de la corrélation, la façon de trouver les personnes ayant les compétences adéquates et la bonne attitude pour exécuter ce travail, et comment nous avons traité les problèmes de protection des renseignements personnels et de sécurité.

    Date de diffusion : 2014-10-31

  • Articles et rapports : 11-522-X201300014274
    Description :

    Qu’entend-on par mégadonnées? Peuvent-elles remplacer ou compléter les enquêtes officielles? Quels sont certains des défis liés à l’utilisation des mégadonnées pour les statistiques officielles? Quelles sont certaines des solutions possibles? L’automne dernier, Statistique Canada a investi dans un projet pilote sur les mégadonnées afin de répondre à certaines de ces questions. Il s’agissait du premier projet d’enquête auprès des entreprises de cette sorte. Le présent document abordera certaines des leçons apprises dans le cadre du projet pilote de mégadonnées pour les données des compteurs intelligents.

    Date de diffusion : 2014-10-31

  • Articles et rapports : 11-522-X201300014283
    Description :

    Le projet Methodologies for an integrated use of administrative data (MIAD) du Réseau statistique a pour but d’élaborer des méthodologies en vue d’un usage intégré des données administratives (DA) dans le processus statistique. Le principal objectif du projet MIAD est de fournir des lignes directrices pour l’exploitation des DA à des fins statistiques. En particulier, les membres du projet ont élaboré un cadre de la qualité, ont fourni une représentation des utilisations possibles des DA et proposé un schéma des différents contextes informatifs. Le présent article est axé sur ce dernier aspect. En particulier, nous faisons la distinction entre les dimensions en rapport avec les caractéristiques de la source associées à l’accessibilité, d’une part, et les caractéristiques associées à la structure des DA et à leurs liens avec les concepts statistiques, d’autre part. Nous désignons la première catégorie de caractéristiques comme étant le cadre de l’accès et la deuxième catégorie de caractéristiques comme étant le cadre des données. Dans le présent article, nous nous concentrons principalement sur la deuxième catégorie de caractéristiques qui sont reliées spécifiquement au type d’information qui peut être obtenu à partir de la source secondaire. En particulier, ces caractéristiques ont trait à la population administrative cible et à la mesure de cette population ainsi que la façon dont elle est (ou pourrait être) liée à la population cible et aux concepts statistiques cibles.

    Date de diffusion : 2014-10-31

  • Articles et rapports : 11-522-X201300014284
    Description :

    La diminution des taux de réponse observée par plusieurs instituts nationaux de statistique, leur volonté de limiter le fardeau de même que l’importance des contraintes budgétaires auxquelles ils font face favorisent une utilisation accrue des données administratives pour la production de renseignements statistiques. Les sources de données administratives qu’ils sont amenés à considérer doivent être évaluées afin d’en déterminer l’adéquation à l’utilisation, et ce en tenant compte de plusieurs aspects. Une démarche d’évaluation des sources de données administratives en vue de leur utilisation comme intrant à des processus de production de renseignements statistiques a récemment été élaborée à Statistique Canada. Celle-ci comprend essentiellement deux phases. La première phase ne nécessite que l’accès aux métadonnées associées aux données administratives considérées alors que la deuxième est effectuée à partir d’une version des données permettant l’évaluation. La démarche et l’outil d’évaluation sont présentés dans cet article.

    Date de diffusion : 2014-10-31

  • Articles et rapports : 82-003-X201400311908
    Géographie : Canada
    Description :

    La présente étude compare les estimations de la prévalence de la MPOC fondées sur des données autodéclarées avec celles obtenues à partir de mesures de la fonction pulmonaire effectuées au cours du cycle 1 de l'Enquête canadienne sur les mesures de la santé de Statistique Canada.

    Date de diffusion : 2014-03-19

  • Articles et rapports : 82-003-X201300111764
    Géographie : Province ou territoire
    Description :

    La présente étude compare deux sources d'information sur la consommation de médicaments sur ordonnance par les personnes de 65 ans et plus en Ontario - l'Enquête sur la santé dans les collectivités canadiennes (ESCC) et la base de données des demandes de paiement pour médicaments du Programme de médicaments de l'Ontario (PMO). L'analyse porte sur les médicaments contre les troubles cardiovasculaires et le diabète, parce qu'ils sont utilisés fréquemment, et que presque tous sont prescrits régulièrement.

    Date de diffusion : 2013-01-16

  • Articles et rapports : 82-003-X201100211474
    Description :

    La présente étude compare le nombre de consultations pour soins de santé mentale déclarées dans le cadre de l'Enquête sur la santé dans les collectivités canadiennes de 2002 : Santé mentale et bien être et le nombre de ces consultations selon les dossiers administratifs provinciaux, les codes de diagnostic servant à déterminer les consultations pertinentes dans les données administratives.

    Date de diffusion : 2011-06-15
Références (16)

Références (16) (0 à 10 de 16 résultats)

  • Enquêtes et programmes statistiques — Documentation : 11-633-X2021002
    Description :

    La base de données longitudinales sur l’immigration (BDIM) est une source importante et complète de données contribuant à mieux comprendre le comportement économique des immigrants. Il s’agit du seul ensemble annuel de données canadiennes permettant d’étudier les caractéristiques des immigrants au Canada au moment de leur admission ainsi que leur situation économique et leur mobilité régionale (interprovinciale) sur plus de 35 ans. La BDIM comprend les dossiers administratifs d'Immigration, Réfugiés et Citoyenneté Canada (IRCC) qui contiennent des renseignements exhaustifs sur les immigrants admis au Canada depuis 1952. Elle comprend également des données sur les résidents non permanents à qui on a délivré des permis de séjour temporaire depuis 1980. Ce rapport traitera des sources de données, des concepts et des variables de la BDIM, du couplage d’enregistrements, du traitement des données, de la diffusion, de l’évaluation des données et des indicateurs de qualité, de la comparabilité avec d’autres ensembles de données relatives à l’immigration ainsi que des analyses que permet la BDIM.

    Date de diffusion : 2021-02-01

  • Enquêtes et programmes statistiques — Documentation : 11-633-X2019005
    Description :

    La base de données longitudinales sur l’immigration (BDIM) est une source importante et complète de données contribuant à mieux comprendre le comportement économique des immigrants. Il s’agit du seul ensemble annuel de données canadiennes permettant d’étudier les caractéristiques des immigrants au Canada au moment de leur admission ainsi que leur situation économique et leur mobilité régionale (interprovinciale) sur plus de 35 ans. La BDIM comprend les dossiers administratifs d'Immigration, Réfugiés et Citoyenneté Canada (IRCC) qui contiennent des renseignements exhaustifs sur les immigrants admis au Canada depuis 1952. Elle comprend également des données sur les résidents non permanents à qui on a délivré des permis de séjour temporaire depuis 1980. Ce rapport traitera des sources de données, des concepts et des variables de la BDIM, du couplage d’enregistrements, du traitement des données, de la diffusion, de l’évaluation des données et des indicateurs de qualité, de la comparabilité avec d’autres ensembles de données relatives à l’immigration ainsi que des analyses que permet la BDIM.

    La BDIM a été diffusée en plusieurs étapes. Les sections 2.2 et 7 de ce rapport ont été révisées pour refléter les mises à jour.

    Date de diffusion : 2020-07-20

  • Enquêtes et programmes statistiques — Documentation : 11-633-X2018019
    Description :

    La base de données longitudinales sur l’immigration (BDIM) est une source importante et complète de données contribuant à mieux comprendre le comportement économique des immigrants. Il s’agit du seul ensemble annuel de données canadiennes permettant d’étudier les caractéristiques des immigrants au Canada au moment de leur admission ainsi que leur situation économique et leur mobilité régionale (interprovinciale) sur plus de 30 ans. La BDIM combine des fichiers de données administratives sur les admissions d’immigrants et sur les permis de résidence non permanente provenant d’Immigration, Réfugiés et Citoyenneté Canada (IRCC) à des fichiers de données fiscales provenant de l’Agence du revenu du Canada (ARC). Ces données sont disponibles pour des immigrants déclarants admis à partir de 1980. Les dossiers de déclarants sont disponibles pour les immigrants déclarants depuis 1982. Ce rapport vise à discuter des sources de données, des concepts et des variables de la BDIM, du couplage d’enregistrements, du traitement des données, de la diffusion, de l’évaluation des données et des indicateurs de qualité, de la comparabilité avec d’autres ensembles de données relatifs à l’immigration ainsi que des analyses que permet la BDIM.

    Date de diffusion : 2018-12-10

  • Enquêtes et programmes statistiques — Documentation : 11-633-X2018011
    Description :

    La base de données longitudinales sur l’immigration (BDIM) est une source importante et complète de données contribuant à mieux comprendre le comportement économique des immigrants. Il s’agit du seul ensemble annuel de données canadiennes permettant d’étudier les caractéristiques des immigrants au Canada au moment de leur admission ainsi que leur situation économique et leur mobilité régionale (interprovinciale) sur plus de 30 ans. La BDIM combine des fichiers de données administratives sur les admissions d’immigrants et sur les permis de résidence non permanente provenant d’Immigration, Réfugiés et Citoyenneté Canada (IRCC) à des fichiers de données fiscales provenant de l’Agence du revenu du Canada (ARC). Ces données sont disponibles pour des immigrants déclarants admis à partir de 1980. Les dossiers de déclarants sont disponibles pour les immigrants déclarants depuis 1982.

    Ce rapport vise à discuter des sources de données, des concepts et des variables de la BDIM, du couplage d’enregistrements, du traitement des données, de la diffusion, de l’évaluation des données et des indicateurs de qualité, de la comparabilité avec d’autres ensembles de données relatifs à l’immigration ainsi que des analyses que permet la BDIM.

    Date de diffusion : 2018-01-08

  • Enquêtes et programmes statistiques — Documentation : 11-522-X201700014716
    Description :

    Les données administratives, selon leur source et leur objectif original, peuvent être considérées comme plus fiables au chapitre de l’information que les données recueillies dans le cadre d’une enquête. Elles ne nécessitent pas qu’un répondant soit présent et comprenne le libellé des questions, et elles ne sont pas limitées par la capacité du répondant à se rappeler des événements rétrospectivement. La présente communication compare certaines données d’enquête, comme des variables démographiques, tirées de l’Étude longitudinale et internationale des adultes (ELIA), à diverses sources administratives pour lesquelles des ententes de couplage avec l’ELIA sont en place. La correspondance entre les sources de données, et certains des facteurs qui pourraient l’affecter, sont analysés pour divers aspects de l’enquête.

    Date de diffusion : 2016-03-24

  • Enquêtes et programmes statistiques — Documentation : 11-522-X201700014717
    Description :

    Les fichiers comprenant des données couplées du Système d’information sur les étudiants postsecondaires (SIEP) de Statistique Canada et des données fiscales peuvent servir à examiner les trajectoires des étudiants qui poursuivent des études postsecondaires (EPS) et leurs résultats sur le marché du travail par la suite. D’une part, les données administratives sur les étudiants couplées de façon longitudinale peuvent fournir des renseignements agrégés sur les trajectoires des étudiants pendant leurs études postsecondaires, comme les taux de persévérance, les taux de diplomation, la mobilité, etc. D’autre part, les données fiscales peuvent compléter le SIEP et fournir des renseignements sur les résultats au chapitre de l’emploi, comme la rémunération moyenne et médiane ou la progression de la rémunération selon le secteur d’emploi (industrie), le domaine d’études, le niveau de scolarité et/ou d’autres données démographiques, année après année suivant l’obtention du diplôme. Deux études longitudinales pilotes ont été menées au moyen de données administratives sur les étudiants postsecondaires d’établissements des Maritimes, qui ont été couplées de façon longitudinale et avec le fichier de données fiscales de Statistique Canada (le fichier sur la famille T1) pour les années pertinentes. Cet article met d’abord l’accent sur la qualité des renseignements compris dans les données administratives et sur la méthode utilisée pour mener ces études longitudinales et calculer des indicateurs. En deuxième lieu, elle portera sur certaines limites liées à l’utilisation de données administratives, plutôt que de données d’enquête, pour définir certains concepts.

    Date de diffusion : 2016-03-24

  • Enquêtes et programmes statistiques — Documentation : 11-522-X201700014741
    Description :

    Le mandat de Statistique Canada comprend la production de données statistiques en vue de faire la lumière sur les questions d’actualité touchant les entreprises. Le couplage des enregistrements de données d’entreprises est un aspect important de l’élaboration, de la production, de l’évaluation et de l’analyse de ces données statistiques. Comme le couplage d’enregistrements peut faire intrusion dans la vie privée, Statistique Canada n’y recourt que si l’intérêt public est manifeste et l’emporte sur les inconvénients de l’intrusion. Le couplage d’enregistrements connaît un renouveau déclenché par un usage plus important de données administratives par un grand nombre de programmes statistiques. Le couplage d’enregistrements de données d’entreprises pose de nombreux défis. Par exemple, plusieurs fichiers administratifs ne contiennent pas d’identificateurs communs, les données sont consignées dans des formats non normalisés, certaines données contiennent des erreurs typographiques, les fichiers de données administratives sont habituellement de grande taille, et enfin, l’évaluation de multiples paires d’enregistrements rend les comparaisons absolues difficiles, voire parfois impossibles. Étant donné l’importance et les défis du couplage d’enregistrements, Statistique Canada a élaboré une norme en vue d’aider les utilisateurs à optimiser leur processus de couplage d’enregistrements de données d’entreprises. Ainsi, ce processus comprend l’exploitation d’une stratégie de groupement des enregistrements qui réduit le nombre de paires d’enregistrements à comparer et à apparier, l’utilisation d’un logiciel interne de Statistique Canada pour procéder à des couplages déterministes et probabilistes, et la création de champs standardisés pour le nom et l’adresse des entreprises dans le Registre des entreprises de Statistique Canada. Le présent article donne un aperçu de la méthode de couplage d’enregistrements de données d’entreprises et examine divers projets économiques qui font appel au couplage d’enregistrements à Statistique Canada, notamment dans les domaines des Comptes nationaux, du commerce international, de l’agriculture et du Registre des entreprises.

    Date de diffusion : 2016-03-24

  • Enquêtes et programmes statistiques — Documentation : 11-522-X201700014747
    Description :

    La Base de données longitudinales sur les immigrants (BDIM) combine des données du Fichier des immigrants reçus (FIR) et des fichiers annuels de l’impôt. Ce couplage d’enregistrements est effectué au moyen d’une base de données de déclarants fiscaux. Le FIR comprend tous les immigrants qui ont été admis au Canada depuis 1980. En vue de remanier la BDIM, on a étudié la possibilité d’ajouter les résidents temporaires (RT) et les immigrants qui ont été admis entre 1952 et 1979 (PRE80). L’ajout de ces renseignements donnerait un aperçu plus complet de la population immigrante vivant au Canada. Afin d’intégrer les fichiers des RT et des PRE80 dans la BDIM, on a procédé à un couplage d’enregistrements entre ces deux fichiers et la base de données des déclarants fiscaux. Cet exercice a posé un défi, en partie en raison de la présence d’enregistrements en double dans les fichiers et de liens conflictuels entre les différents couplages d’enregistrements.

    Date de diffusion : 2016-03-24

  • Enquêtes et programmes statistiques — Documentation : 11-522-X201700014749
    Description :

    Dans le cadre du remaniement du Programme de la statistique du tourisme, Statistique Canada élabore l’Enquête nationale sur les voyages (ENV), qui recueillera de l’information relativement aux voyages effectués par les voyageurs canadiens. Cette nouvelle enquête remplacera l’actuelle Enquête sur les voyages des résidents du Canada, de même que la composante reliée aux voyages des résidents canadiens de l’Enquête sur les voyages internationaux. L’ENV tirera parti des bases de sondage communes de Statistique Canada et des outils de traitement communs, tout en maximisant l’utilisation des données administratives. Dans cette communication, on montrera comment les données administratives, comme celles provenant des fichiers de Passeport Canada, de l’Agence des services frontaliers du Canada et de l’Agence du revenu du Canada, pourraient servir à améliorer l’efficacité du plan de sondage de l’ENV.

    Date de diffusion : 2016-03-24

  • Enquêtes et programmes statistiques — Documentation : 75-005-M2015001
    Description :

    À partir de l'Enquête expérimentale sur le milieu du travail de 2011 ce document technique fait un résumé des principaux résultats de l'enquête et évalue la qualité des données.

    Date de diffusion : 2015-04-28
Date de modification :