Études analytiques : méthodes et références
Base de données longitudinales sur l'immigration (BDIM)
Rapport technique, 2016

Warning Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

par Rose Evra et Elena Prokopenko
Division de la statistique sociale et autochtone

Date de diffusion : le 10 décembre 2018 Date de révision : le 11 juillet 2019

Renseignements supplémentaires Version PDF

Passer au texte

Sur cette page

Remerciements
Aperçu
Glossaire
1 Introduction
2 Sources des données
3 Concepts et variables
4 Couplage d'enregistrements
5 Traitement des données
6 Diffusion
7 Évaluation des données et indicateurs de qualité
8 Comparabilité
9 Nouvelles analyses possibles grâce à la BDIM
10 Résumé
Annexes
Bibliographie
Notes

Début du texte

Avis de révision

Des révisions ont été faites à ce produit. Veuillez prendre note des changements suivant :

le 11 juillet 2019
La section 3.4.1 du Rapport technique de la Base de données longitudinales sur l’immigration (BDIM), 2016, a été mise à jour. Une nouvelle section (7.6) sur l'évaluation de la qualité de la variable de la Province de résidence (PRCO_) a été ajoutée ; cette section comprend un nouveau tableau.

le 11 janvier 2019
Une nouvelle section (7.1.1.1) a été ajoutée au Rapport technique de la Base de données longitudinales sur l’immigration (BDIM), 2016. Les chiffres du tableau 14 du document PDF anglais ont été mis à jour.

Remerciements

Nous souhaitons souligner la contribution particulière des personnes suivantes : Laetitia Martin de la Division de la statistique sociale et autochtone (DSSEA), qui a rédigé les sections 3.3.1 à 3.3.3 de ce rapport, Alexandr Diaz-Papkovich de la Division des méthodes d'enquêtes sociales (DMES), qui a vérifié les sections du rapport relatives à la méthodologie sous-tendant la production de la BDIM, ainsi que Tristan Cayn, Caroline Li, Ian Marrs, Scott McLeish et Eric Mongrain, membres de l'équipe des données administratives, qui produisent la BDIM et ont contribué au contenu de plusieurs sections du rapport.

De plus, nous remercions les personnes suivantes d'avoir relu le rapport avant sa publication : Margareta Dovgal, Benoît St-Jean, Winnie Chan, Hélène Maheux et Tiana Major (Statistique Canada), Yoko Yoshida (Département de sociologie et d'anthropologie sociale, Université Dalhousie), Michael Haan (Chaire de recherche du Canada en migration et relations ethniques et Département de sociologie de l'Université de Western Ontario) et Ian Clara (Centre de données de recherche du Manitoba).

Aperçu

La base de données longitudinales sur l'immigration (BDIM) est une source importante et complète de données contribuant à mieux comprendre le comportement économique des immigrants. Il s'agit du seul ensemble annuel de données canadiennes permettant d'étudier les caractéristiques des immigrants au Canada au moment de leur admission ainsi que leur situation économique et leur mobilité régionale (interprovinciale) sur plus de 30 ans.

La BDIM combine des fichiers de données administratives sur les admissions d'immigrants et sur les permis de résidence non permanente provenant d'Immigration, Réfugiés et Citoyenneté Canada (IRCC) à des fichiers de données fiscales provenant de l'Agence du revenu du Canada (ARC). Ces données sont disponibles pour des immigrants déclarants admis à partir de 1980. Les dossiers de déclarants sont disponibles pour les immigrants déclarants depuis 1982.

Ce rapport vise à discuter des sources de données, des concepts et des variables de la BDIM, du couplage d'enregistrements, du traitement des données, de la diffusion, de l'évaluation des données et des indicateurs de qualité, de la comparabilité avec d'autres ensembles de données relatifs à l'immigration ainsi que des analyses que permet la BDIM.

Mots clés : données administratives, immigration, BDIM, données longitudinales, résidents non permanents, déclarants

Glossaire

Ci-après figure la signification des sigles utilisés dans le présent rapport.

Glossaire
Sommaire du tableau
Le tableau montre les résultats de Glossaire. Les données sont présentées selon Acronyme français (titres de rangée) et Acronyme anglais et Définition (figurant comme en-tête de colonne).
Acronyme français	Acronyme anglais	Définition
ARC	CRA	Agence du revenu du Canada
BDIM	IMDB	Base de données longitudinales sur l'immigration
DAL	LAD	Banque de données administratives longitudinales
ECDS	SDLE	Environnement de couplage de données sociales
ELIC	LSIC	Enquête longitudinale auprès des immigrants du Canada
ENM	NHS	Enquête nationale auprès des ménages
FFT1	T1FF	Fichier sur la famille T1
FIR	ILF	Fichier des immigrants reçus
FRPN	PNRF	Fichier intégré des résidents permanents et non permanents
FRN	NRF	Fichier des résidents non permanents
FRN, permis	NRF, Permits	Fichier des résidents non permanents, permis
IPC	CPI	Indice des prix à la consommation
IRCC	IRCC	Immigration, Réfugiés et Citoyenneté Canada
RNP	NPR	Résident non permanent
RP	PR	Résident permanent

1 Introduction

La BDIM combine des fichiers de données administratives sur les admissions d'immigrants et sur les permis de résidence non permanente provenant d'Immigration, Réfugiés et Citoyenneté Canada^{Note 1} (IRCC) à des fichiers de données fiscales provenant de l'Agence du revenu du Canada (ARC). Ces données sont disponibles pour des immigrants déclarants admis à partir de 1980. Les dossiers de déclarants sont disponibles pour les immigrants déclarants depuis 1982.

La BDIM vise à fournir des données détaillées et fiables sur l'efficacité et les répercussions des programmes d'immigration. En tant que base de données sur les immigrants déclarants, la BDIM peut être utilisée pour répondre aussi bien à de vastes questions de recherche qu'à des questions plus précises. Cette base de données fournit également des renseignements sur l'expérience avant l'admission, comme les permis de travail ou d'études. Sa principale force est qu'elle permet d'analyser la situation socioéconomique sur une période suffisamment longue pour pouvoir évaluer les répercussions des caractéristiques de l'immigration à l'admission (y compris la catégorie d'admission, le niveau de scolarité et les connaissances en français ou en anglais) sur les résultats. De plus, les renseignements annuels sur le lieu de résidence permettent d'étudier la migration secondaire (les déménagements ultérieurs des immigrants au Canada). Il est à noter que les mises à jour annuelles de la BDIM sont indépendantes les unes des autres. D'année en année, il y a des changements aux processus de création des données, incluant à l'Identificateur personnel unique (IMDB_ID).

Depuis son origine, la BDIM est constituée de plusieurs fichiers : un pour chaque année d'imposition depuis 1982, deux contenant les caractéristiques d'immigration au niveau personnel et un fichier sur les permis de résidence non permanente. La BDIM est mise à jour chaque année au moyen de techniques de couplage décrites dans le présent rapport. Chaque année, une nouvelle année d'imposition est ajoutée à la base de données ainsi que des données relatives aux nouvelles admissions et aux permis de résidence non permanente.

Les fichiers de la BDIM sont uniquement accessibles aux membres des Centres de recherche de données (CRD), aux chercheurs de Statistique Canada et aux personnes réputées y être employées. Cette précaution veille à ce que les mesures adéquates de respect des renseignements personnels soient prises, afin de protéger les renseignements personnels et la confidentialité. Les informations liées à la BDIM sont à la disposition du public sous forme de tableaux sommaires agrégés annuels que produit Statistique Canada et qui sont publiés sur son site Web. De plus, des chercheurs externes peuvent demander des tableaux et analyses ponctuels; Statistique Canada fournit ces services selon une formule de recouvrement des coûts.

Le présent rapport vise à discuter des sources de données de la BDIM (section 2), de ses concepts et variables (section 3), du couplage d'enregistrements (section 4), du traitement des données (section 5), de sa diffusion (section 6), de l'évaluation des données et des indicateurs de qualité (section 7), de sa comparabilité avec d'autres ensembles de données relatifs à l'immigration (section 8) ainsi que des analyses que la BDIM permet (section 9).

2 Sources des données

Plusieurs fichiers sont nécessaires pour créer la BDIM. Ces fichiers, décrits dans la présente section, comprennent des données d'immigration, des fichiers de données fiscales d'immigrants et des fichiers auxiliaires couvrant de nombreuses années.

2.1 Données sur l'immigration

Chaque année, Statistique Canada (StatCan) reçoit d'IRCC les données d'admission relatives aux nouveaux titulaires de permis de résidence permanente et non permanente.

2.1.1 Fichier intégré des résidents permanents et non permanents (FRPN)

Chaque année les données d'admission sont ajoutées pour créer le Fichier des immigrants reçus (FIR). Ce fichier contient des renseignements tels que la date d'admission, la date de naissance et la catégorie d'immigration. Le FIR peut être considéré comme le recensement des personnes ayant immigré au Canada à titre de résidents permanents depuis 1980; il présente des renseignements sur leurs caractéristiques lors de leur admission. Ce fichier n'est cependant pas à la disposition des utilisateurs de la BDIM. Cette dernière porte uniquement sur les immigrants ayant produit au moins une déclaration de revenus depuis 1982. Les données d'admission de ces immigrants déclarants sont disponibles au sein du Fichier intégré des résidents permanents et non permanents (FRPN).

Le FIR, qui consigne les données administratives relatives à la résidence permanence, surestime le nombre d'immigrants vivant actuellement au Canada. Cet écart s'explique de deux façons. Tout d'abord, le FIR ne recense pas les personnes ayant quitté le pays. Des immigrants peuvent être en effet repartis du Canada après leur admission. Ensuite, les décès des immigrants admis à partir de 1980 ne sont que partiellement consignés. Des renseignements supplémentaires sur les données relatives à la mortalité sont présentés à la section 7.2.

Les chercheurs peuvent accéder au Fichier intégré des résidents permanents et non permanents (FRPN, l'acronyme anglais est PNRF), qui combine des données du FIR et du FRN au niveau des personnes. Le FRPN permet aux utilisateurs de suivre l'historique de la migration des immigrants, notamment leur expérience avant leur admission au Canada. Le FRPN contient des données détaillées sur les caractéristiques sociodémographiques des immigrants admis au Canada depuis 1980; cela permet, par exemple, de déterminer si une personne était un résident non permanent avant son admission. Il est important de noter que les enregistrements des résidents non permanents n'étant pas devenus des résidents permanents ne sont pas inclus dans ce fichier. Ce dernier contient en revanche le nombre de permis pour chaque résident non permanent devenu résident permanent ainsi que sa date d'admission. Le FRPN peut également comprendre une date de décès, lorsqu'un lien vers l'enregistrement de décès a été établi (voir la section 7.2.2). Pour de plus amples détails sur le contenu de ce fichier, reportez-vous à la composante relative à l'immigration du dictionnaire de la BDIM, sections 3.3 et 3.4 de ce rapport.

Les données des immigrants qui n'ont pas produit de déclaration fiscales depuis 1982 ou qui n'ont pas été appariés sont dans le fichier PNRF_Nonfilers. De plus, un fichier appelé PNRF_EXTRA est à la disposition des utilisateurs de données; il comprend des variables qui ont été retirées, qui ont peu de valeur analytique ou pour lesquelles aucune métadonnée n'est disponible. La liste complète des variables se trouve dans le dictionnaire de données sur l'immigration de la BDIM.

2.1.2 Fichier des résidents non permanents (FRN)

Des données relatives aux personnes ayant obtenus des permis de résidence non permanents depuis 1980 ont été utilisées pour créer le Fichier des résidents non permanents (FRN, NRF_Permit). Ce fichier comprend le type de permis (de travail ou d'études, par exemple) et la dernière date de validité d'un permis par exemple. Il est mis à jour chaque année en y ajoutant les données annuelles relatives aux nouveaux permis de résidence non permanente.

Une personne peut en posséder plusieurs permis, puisqu'une même personne peut bénéficier de nombreux permis à différents moments. Le fichier NRF_Person consigne de tels renseignements au niveau de l'individu, ce fichier comprend entre autres le nombre de permis et la première année où un permis fut émis.

Ces données peuvent être liées au FRPN en utilisant l'identificateur personnel unique de la BDIM (IMDB_ID). Pour de plus amples détails sur les variables incluses dans les fichiers veuillez vous référer à la composante relative à l'immigration du dictionnaire de la BDIM.

2.2 Fichier sur la famille T1

Les fichiers de données fiscales utilités pour créer les fichiers IMDB_T1FF sont ceux que contient le fichier sur la famille T1^{Note 2} (FFT1). Statistique Canada obtient les fichiers T1 individuels annuels, les fichiers fiscaux T4 et les fichiers de la Prestation fiscale canadienne pour enfants (PFCE)^{Note 3} auprès de l'ARC et crée le Fichier sur la famille T1 pour l'année en question. Le traitement comprend de nombreuses étapes, allant du codage géographique à la formation de familles (p. ex. lorsqu'un déclarant mentionne une conjointe également déclarante, cette dernière est associée au déclarant initial par un identificateur commun). Les données du FFT1 remontent jusqu'à l'année d'imposition de 1982. Grâce à l'expérience acquise au cours des nombreuses années de traitement du FFT1, des règles de vérification ont été créées pour réduire le nombre d'incohérences au sein de la base de données et améliorer la qualité des données.

La disponibilité des variables fiscales dépend des renseignements recueillis pour une année donnée. Le FFT1 produit chaque année pour la BDIM comprend les revenus individuels et familiaux ainsi que les variables de composition de la famille, telles que le nombre d'enfants et l'identificateur de conjoint. La BDIM contient les fichiers IMDB_T1FF à compter de 1982 pour les immigrants déclarants. Le processus de création de ces fichiers est décrit à la section 5.1. Pour de plus amples détails sur les variables incluses dans les fichiers IMDB_T1FF, veuillez vous reporter à la composante relative aux données fiscales du dictionnaire de la BDIM.

2.3 Environnement de couplage de données sociales (ECDS)

Pour créer la BDIM, l'Environnement de couplage de données sociales (ECDS) a été utilisé pour produire le couplage de données. L'ECDS de Statistique Canada favorise l'exploitation novatrice des données administratives et des données d'enquête existantes pour répondre à des questions de recherche importantes et éclairer les politiques socioéconomiques grâce au couplage d'enregistrements. L'ECDS augmente le potentiel d'intégration des données de différents domaines comme la santé, la justice, l'éducation et le revenu grâce à la création de fichiers de données analytiques couplés, sans qu'il soit nécessaire de recueillir d'autres renseignements auprès des Canadiens.

3 Concepts et variables

3.1 Statut d'immigrant au Canada

La BDIM fournit des données sur un sous-ensemble de la population des immigrants, tel qu'il est décrit à la section 2. Trouvez ci-après les définitions des termes « immigrants » et « résidents non permanents » selon Statistique Canada.

Le terme « immigrant » désigne des personnes qui sont, ou ont déjà été, des immigrants reçus ou des résidents permanents; c'est-à-dire auxquelles les autorités de l'immigration ont accordé le droit de résider au Canada en permanence. Les immigrants ayant obtenu la citoyenneté canadienne par naturalisation sont également inclus dans cette catégorie.

Les « résidents non permanents » ne sont pas considérés comme des immigrants, même s'il s'agit d'une population sur laquelle porte également la BDIM, comme le décrit la section 2. Dans la BDIM, le terme « résident non permanent » désigne une personne originaire d'un autre pays, titulaire d'un permis de travail ou d'études ou qui revendique le statut de réfugié. Ces personnes sont autorisées à demeurer au Canada pour la période indiquée sur leur permis.

3.1.1 Aperçu de l'immigration au Canada

Un article de Mégatendances canadienne, 150 ans d'immigration au Canada^{Note 4}, paru en 2016, résume la fluctuation des niveaux d'immigration et des pays d'origine au cours du dernier siècle. La migration au Canada a été continue depuis la fondation du pays. Plus de 17 millions d'immigrants se sont installés au Canada depuis 1867. Le nombre d'immigrants reçus a augmenté, passant d'environ 200 000 dans les années 1990 à plus de 250 000 au début des années 2010. La proportion des Canadiens nés à l'étranger a augmenté, passant de 14,7 % en 1951 (2,06 millions de personnes) à 21,9 % en 2016 (7,5 millions de personnes).

En vertu de l'article 95 de la Loi constitutionnelle de 1867, l'immigration est un domaine de pouvoir partagé entre le gouvernement fédéral et les gouvernements provinciaux. D'autres lignes directrices, définies dans la Loi sur l'immigration et la protection des réfugiés de 2002 (LIPR)^{Note 5}, précisent les objectifs et la direction stratégique de la politique d'immigration du gouvernement du Canada, que régit en partie Immigration, Réfugiés et Citoyenneté Canada (IRCC). Avant 2002, la Loi sur l'immigration de 1976 servait de principale loi en matière d'immigration au Canada.

Conformément à la LIPR, le gouvernement du Canada est chargé « de stipuler les exigences en matière d'admissibilité, de fixer les niveaux nationaux d'immigration, de définir les catégories d'immigration, de prendre des décisions concernant les demandes d'asile présentées au Canada, de réunifier les familles et d'établir les critères d'admissibilité pour les programmes d'établissement^{Note 5} » pour toutes les provinces et les territoires, à l'exception du Québec. La province du Québec est entièrement responsable de ses niveaux, programmes et politiques d'immigration en vertu de l'Accord Canada-Québec relatif à l'immigration et à l'admission temporaire des aubains. Le gouvernement fédéral continue, cependant, à sélectionner et à traiter les immigrants que parrainent les familles, les personnes protégées au Canada et les personnes revendiquant le statut de réfugié au Québec^{Note 5}.

Les résidents permanents sont des personnes ayant été autorisées à vivre au Canada de façon permanente, qui ont le droit d'y travailler et d'y étudier, mais qui ne sont pas devenues des citoyens canadiens^{Note 6} ». En vertu de la LIPR, il existe trois catégories générales d'immigrants : les immigrants économiques, les immigrants parrainés pas la famille et les réfugiés.

Les résidents permanents peuvent devenir citoyens du Canada lorsqu'ils répondent à certaines exigences. La première est une exigence de résidence, selon laquelle le résident permanent doit avoir été présent au Canada pendant une période définie. Les résidents permanents doivent également être âgés de plus de 18 ans; dans le cas de mineurs, la demande doit être effectuée simultanément (concomitante) à celle de l'un ou des deux parents ou après (non concomitante) que l'un des parents ou les deux sont devenus citoyens canadiens. Les résidents permanents doivent avoir honoré leurs obligations de déclaration de revenus auprès du Canada. Les résidents permanents âgés de 14 à 64 ans doivent en outre présenter une preuve de maîtrise d'au moins l'une des langues officielles du Canada et avoir passé l'examen de citoyenneté (IRCC, 2016; gouvernement du Canada, 2016).

La LIPR stipule que tous les ressortissants étrangers, à l'exception des résidents permanents, qui entrent au Canada doivent posséder un visa de résidence temporaire. Les visas de résidence temporaire sont délivrés aux travailleurs et étudiants « de manière à optimiser leur apport au développement économique, social et culturel du Canada tout en protégeant la santé des Canadiens et en assurant leur sécurité » (IRCC, 2015). Les résidents non permanents peuvent demander la résidence permanente dans le cadre de divers programmes et peuvent bénéficier d'un avantage par rapport aux demandeurs de l'étranger, s'ils ont étudié au Canada ou y ont acquis une expérience professionnelle.

Quant aux personnes qui revendiquent le statut de réfugié, « la Section de la protection des réfugiés (SPR) est la section de la Commission de l'immigration et du statut de réfugié du Canada (CISR) qui instruit les demandes d'asile présentées au Canada et qui décide de les accepter ou non » (CISR, 2015). Dans le cadre de la BDIM, ces demandeurs sont classés comme résidents non permanents possédant un permis de personne revendiquant le statut de réfugié.

3.2 Population cible et période de couverture

La BDIM est une base de données qui comprend :

Tous les immigrants admis au Canada entre 1980 et 2017;
Tous les résidents non permanents depuis 1980;
Toutes les déclarations fiscales entre 1982 et 2016 pour les immigrants.

Cette base de données fournit également des renseignements sur les permis des immigrants qui étaient résidents non permanents avant leur admission à titre de résidents permanents.

Le FFT1 porte sur « toutes les personnes ayant complété une déclaration de revenu T1 pour l'année de référence ou ayant reçu la Prestation fiscale canadienne pour enfants (PFCE), sur les conjoints faisant partie des non déclarants (y compris les renseignements sur les traitements et salaires figurant dans le fichier T4), sur les enfants non déclarants (données d'identification provenant de trois sources : fichier de la PFCE, fichier des naissances et fichier historique) et sur les enfants ayant produit une déclaration et indiqué l'adresse de leurs parents ». L'information familiale est basée sur le concept de la famille de recensement : parent(s) et les enfants vivant à la même adresse. (Statistique Canada 2017).

La BDIM rassemble, par couplage d'enregistrements probabiliste (voir la section 4), les données administratives d'Immigration, Réfugiés et Citoyenneté Canada (IRCC) et les fichiers fiscaux du FFT1.

3.3 Variables relatives à l'admission

Les immigrants sont admis au Canada dans le cadre de différents programmes ayant tous des objectifs précis. Ces programmes sont des indicateurs des conditions sous lesquelles les immigrants sont admis au pays et du type de soutien reçu lors de leur établissement. Par conséquent, les analyses visant à orienter les politiques publiques devraient normalement en tenir compte. Afin de répondre à des questions de recherche variées, la BDIM comporte plusieurs variables relatives à l'admission des immigrants, toutes dérivées de deux concepts principaux, soit la catégorie d'admission et le type de demandeur.

3.3.1 Catégorie d'admission

La catégorie d'admission désigne le nom du programme ou du groupe de programmes d'immigration en vertu duquel un immigrant a obtenu pour la première fois depuis 1980 le droit de vivre au Canada en permanence par les autorités de l'immigration. Au fil des ans, les immigrants ont été admis au pays dans le cadre de plusieurs dizaines de programmes distincts. Afin de faciliter l'utilisation des données sur le sujet, la BDIM met à la disposition de ses utilisateurs différentes variables à l'intérieur desquelles les programmes ayant des buts similaires sont agrégés. Le plus haut niveau d'agrégation repose sur les trois objectifs principaux de la politique d'immigration du Canada, soit contribuer au développement économique du pays, réunir les familles et protéger les réfugiés.

3.3.1.1 Immigrants économiques

L'admission d'immigrants économiques vise à atteindre le premier des objectifs susmentionnés de la politique d'immigration, c'est-à-dire celui de contribuer à l'économie canadienne. Les immigrants économiques sont répartis dans trois groupes de programmes principaux, soit les programmes des travailleurs, les programmes des gens d'affaires et les programmes de candidats des provinces et territoires.

Les programmes des travailleurs comprennent les immigrants qui ont été sélectionnés pour leur capacité à prendre part au marché du travail. Ceux-ci sont évalués en fonction de leurs compétences et de leur expérience professionnelle et sont répartis en quatre grandes catégories :

Les travailleurs qualifiés sont sélectionnés pour leurs compétences et leur expérience de travail dans des postes de gestion, des postes professionnels, des emplois techniques ou des métiers spécialisés.
Les travailleurs exerçant un métier spécialisé sont sélectionnés plus particulièrement pour leurs compétences et leur expérience de travail dans le cadre d'un métier spécialisé admissible. Ils se distinguent des travailleurs qualifiés par l'exigence de détenir une offre d'emploi valide d'un employeur canadien ou un certificat de compétence délivré par un organisme provincial ou territorial canadien.
Les immigrants admis dans la catégorie de l'expérience canadienne se distinguent des deux premiers groupes par l'exigence de posséder de l'expérience de travail canadienne. Celle-ci doit avoir été acquise dans des postes de gestion, des postes professionnels, des emplois techniques ou des métiers spécialisés.
Les aides familiaux et les personnes soignantes obtiennent leur statut de résident permanent après avoir offert, au Canada et pour une période déterminée, des soins à domicile à des enfants ou à des personnes ayant des besoins spéciaux, telles que des personnes âgées ou des personnes souffrant d'un handicap ou d'une maladie chronique.

Les immigrants économiques admis au Canada dans le cadre des programmes des gens d'affaires sont quant à eux répartis en trois grandes catégories :

Les entrepreneurs sont sélectionnés pour leurs compétences et leur capacité à soit posséder et gérer une entreprise, soit mettre sur pied une entreprise admissible au Canada. Certains possèdent un avoir net minimal alors que d'autres doivent avoir obtenu l'appui d'une organisation désignée pour leur idée d'entreprise.
Les investisseurs obtiennent leur statut de résident permanent à la condition d'investir une somme importante au Canada. Leur placement est attribué aux provinces et aux territoires participants afin de stimuler le développement économique et la création d'emplois.
Les travailleurs autonomes obtiennent leur statut de résident permanent à la condition d'être en mesure — et d'avoir l'intention — de créer leur propre emploi au Canada et de contribuer de façon appréciable à l'économie canadienne. Cette grande catégorie comprend aussi les personnes qui ont l'intention de contribuer de façon appréciable à la vie culturelle ou sportive du pays (p. ex. en tant qu'artiste, acteur, écrivain ou athlète professionnel).

Le dernier groupe de programmes principal dans le cadre duquel les immigrants économiques sont admis est celui des programmes de candidats des provinces et territoires. Comme l'indique le nom du groupe de programmes, les immigrants sont sélectionnés par une province ou un territoire pour contribuer à l'économie locale en répondant à des besoins précis en matière de main-d'œuvre. Ils sont évalués en fonction de critères de sélection relatifs à leur scolarité, à leur expérience de travail et à leurs compétences particulières. Chaque province ou territoire participant possède ses propres critères pour sélectionner son groupe d'intérêt, par exemple les étudiants, les gens d'affaires, les travailleurs spécialisés ou les travailleurs semi-spécialisés.

3.3.1.2 Immigrants parrainés par la famille

L'admission d'immigrants parrainés par la famille vise la réunification des familles et permet aux citoyens canadiens et aux résidents permanents de parrainer des personnes qui leur sont apparentées. Les immigrants admis dans le cadre de tels programmes peuvent recevoir leur statut de résident permanent en raison de leur lien soit comme conjoint, partenaire, parent, grand-parent ou enfant.

Sous certaines conditions, un immigrant admis dans le cadre de tels programmes peut aussi être parrainé en raison d'un autre lien de parenté. C'est le cas par exemple des jeunes frères, sœurs, neveux, nièces et petits-enfants orphelins. Un citoyen canadien ou un résident permanent vivant au Canada peut aussi parrainer quelqu'un sur la base d'un autre lien si personne ne lui est apparenté par les liens décrits plus haut.

À cela s'ajoutent aussi les immigrants qui ont été parrainés par un citoyen canadien ou par un résident permanent vivant au Canada et qui n'auraient normalement pu se qualifier dans le cadre d'aucun programme, mais qui ont reçu, à titre exceptionnel, le statut de résident permanent pour des considérations d'ordre humanitaire.

3.3.1.3 Réfugiés

Le troisième et dernier objectif principal de la politique d'immigration du Canada est celui de protéger les réfugiés, c'est-à-dire les personnes qui ont une crainte fondée de retourner dans leur pays d'origine. Cette catégorie comprend les personnes qui craignent avec raison d'être persécutées pour des motifs liés à leur race, à leur religion, à leur nationalité, à leur appartenance à un groupe social particulier ou à leurs opinions politiques (les réfugiés au sens de la Convention de Genève), de même que les personnes qui ont subi des conséquences graves et personnelles en raison d'une guerre civile, d'un conflit armé ou d'une violation massive des droits de la personne. Certains réfugiés étaient au Canada lorsqu'ils ont demandé l'asile pour eux-mêmes et pour les membres de leur famille avec eux au Canada ou à l'extérieur du pays. D'autres étaient à l'étranger et ont été recommandés par le Bureau du Haut Commissariat des Nations Unies pour les réfugiés (HCR) ou par un autre organisme de recommandation aux fins d'établissement au Canada. Les immigrants qui ont été recommandés reçoivent un soutien pour leur réétablissement de la part de sources gouvernementales, d'organisations, d'individus ou de groupes d'individus du secteur privé, ou encore un soutien provenant à la fois du gouvernement du Canada et d'intervenants du secteur privé.

3.3.1.4 Autres immigrants

En plus des trois objectifs principaux susmentionnés, la politique d'immigration du Canada attribue aux autorités de l'immigration un certain pouvoir discrétionnaire pour octroyer le statut de résident permanent dans le cadre d'un programme qui ne vise ni les immigrants économiques, ni les immigrants parrainés par la famille, ni les réfugiés. Ce programme comprend notamment les immigrants qui ont reçu, à titre exceptionnel, le statut de résident permanent pour des considérations d'ordre humanitaire ou des raisons d'intérêt public.

3.3.2 Type de demandeur

En plus de la catégorie d'admission, la BDIM fournit aux utilisateurs de données des renseignements sur le type de demandeur. Ce concept indique si l'immigrant est identifié comme demandeur principal, comme conjoint ou comme personne à charge dans la demande de visa de résident permanent.

En règle générale, les renseignements sur le type de demandeur sont utilisés aux fins d'analyse dans le cadre de l'étude sur les immigrants économiques. Comme les demandeurs principaux admis en vertu de ces programmes sont sélectionnés pour leur capacité à contribuer à l'économie canadienne, il est pertinent de les distinguer de leurs conjoints et de leurs personnes à charge qui, eux, n'ont pas été évalués en fonction de cette même capacité. En isolant les demandeurs principaux des autres demandeurs, l'efficacité de ces programmes peut alors être étudiée de façon plus directe.

Par contre, en ce qui concerne la réunification des familles et la protection des réfugiés, le but de la politique d'immigration demeure le même pour toutes les personnes qui présentent une même demande, et ce, sans égard au type de demandeur. Dans le cas des immigrants admis en vertu de ces deux objectifs, le concept du « type de demandeur » revêt donc plutôt une valeur administrative.

La valeur administrative du concept est particulièrement marquée pour les immigrants ayant le statut de demandeur principal, lequel ne dépend pas systématiquement du lien juridique entre les demandeurs de résidence permanente. Par exemple, dans le cas de la catégorie d'admission des conjoints et des partenaires parrainés, le conjoint est répertorié comme demandeur principal, alors que le type de demandeur « conjoint » n'apparaît pas sur la demande de résidence. De plus, dans le cas de la catégorie d'admission des enfants parrainés, le statut de demandeur principal sera désigné de façon nominative pour l'un des enfants, alors que les autres enfants seront désignés comme étant les personnes à charge. Enfin, dans certaines circonstances, la demande de résidence permanente se déroule en deux temps : à partir du Canada pour le demandeur principal, puis à partir de l'étranger pour les autres membres de la famille. Ce type de processus existe pour les aides familiaux résidants et pour les personnes protégées au Canada. Dans ces circonstances, l'un des membres de la famille faisant la demande à partir de l'étranger obtiendra le statut de demandeur principal, et ce, même s'il est le conjoint d'un immigrant approuvé antérieurement suite à une demande faite au Canada.

3.3.3 Changements au fil du temps

La BDIM comprend des renseignements sur les immigrants admis au pays depuis plus d'une trentaine d'années, au cours desquelles plusieurs changements relatifs aux politiques et aux programmes d'immigration sont survenus. De nouveaux programmes ont été créés, d'autres ont été abolis, alors que pour d'autres, les critères de sélection et d'admissibilité ont été modifiés. Ainsi, une personne admise en tant que travailleur qualifié en 1980 n'a pas nécessairement été évaluée selon les mêmes critères que ses homologues admis dans les années 2000. Même si tous les efforts ont été déployés pour tenter de créer les agrégations de programmes les plus similaires possible, l'utilisateur de la BDIM devrait garder en tête ces différences lorsqu'il tire des conclusions au sujet de différentes cohortes d'établissement.

Le changement le plus marquant survenu dans la période couverte par la BDIM est sans doute l'entrée en vigueur de la Loi sur l'immigration et la protection des réfugiés de 2002, qui a remplacé la Loi sur l'immigration de 1976. Même si ces deux lois visent les trois mêmes groupes principaux (immigrants économiques, immigrants parrainés par la famille et réfugiés), l'administration des programmes dans le cadre de celles-ci a subi plusieurs modifications. De plus, les programmes d'admission ont aussi été modifiés en fonction des besoins sociodémographiques et des priorités établies par les gouvernements successifs à l'intérieur même de ces deux cadres législatifs. Pour ces raisons, il est fortement conseillé aux utilisateurs de données s'intéressant à des programmes spécifiques ou à plusieurs cohortes d'établissement de se renseigner sur les changements apportés aux politiques ou aux programmes applicables à leur sujet d'étude.

Il est aussi important de souligner que quelques années peuvent s'écouler avant que les effets d'un changement administratif puissent être observés à l'intérieur de la base de données. Par exemple, lorsqu'un nouveau programme est créé, il peut s'écouler plusieurs mois — voire plusieurs années — entre le moment où celui-ci entre en vigueur (moment où il est possible de poser sa candidature) et le moment où les premiers immigrants sont admis au pays dans le cadre de celui-ci. Un scénario similaire existe pour les programmes abolis. Il peut s'écouler un certain temps entre le moment où toutes les demandes sont évaluées et où toutes les personnes admissibles sont reçues au pays et celui où les programmes abolis disparaissent complètement des statistiques sur les admissions annuelles.

3.3.4 Variables de catégorie d'admission du FRPN

Plusieurs catégories d'admission existent au sein du FRPN. Elles sont décrites dans la composante relative à l'immigration du dictionnaire de la BDIM. Cette section fournit de plus amples détails sur certaines de ces variables.

La variable la plus détaillée est celle des catégories d'immigration IMMIGRATION_CATEGORY, qui comprend plus de 100 catégories ayant existé de 1980 jusqu'à la BDIM actuelle. Des agrégats des renseignements disponibles dans la variable IMMIGRATION_CATEGORY figurent dans la variable dérivée de groupement de catégories d'immigration, IMMIGRATION_CATEGORY_CENSUS, qui comprenne un moins grand nombre de catégories.

La variable agrégée IMMIGRATION_CATEGORY_CENSUS est une catégorisation conforme au standard de Statistique Canada utilisé pour le recensement de la population. Elle ne précise, cependant, pas que certains immigrants ont été admis dans le cadre des programmes d'élimination de l'arriéré et d'examen administratif. Ces programmes visaient à accélérer le traitement des dossiers d'immigration à la fin des années 1980, afin de faire face aux crises géopolitiques se déroulant à l'étranger et touchant la capacité de résidents temporaires à retourner dans leur pays (p. ex. manifestations de la place Tian'anmen, dissolution de l'URSS et de la Yougoslavie). Du fait de l'absence de distinction de ces catégories, ces personnes, dont le dossier a été traité rapidement selon des critères différents, ne peuvent être comparées aux autres immigrants dont les dossiers figurent dans les mêmes catégories. Pour recenser les immigrants admis dans le cadre de ces programmes, les utilisateurs doivent se reporter aux variables d'élimination de l'arriéré BACKLOG_CLEARANCE_IND et d'examen administratif ADMINISTRATIVE_REVIEW_IND (disponibles dans le fichier PNRF_extra, pour les années d'admission antérieures à 2014).

L'utilisateur peut également utiliser les renseignements agrégés sur l'immigration de la variable de groupement de catégories d'immigration IMMIGRATION_CATEGORY_ROLLUP2 disponible dans le fichier PNRF_extra pour les immigrants admis jusqu'à 2013. Cette variable vise à fournir des informations cohérentes indépendamment des divers changements de politique et de réglementation (p. ex. Loi sur l'immigration et la protection des réfugiés de 2002 et Loi sur l'immigration de 1976) et pour maintenir au cours du temps des programmes particuliers relatifs à l'immigration (p. ex. travailleurs qualifiés). Cette variable offre des renseignements détaillés sur les initiatives d'élimination de l'arriéré et d'examen administratif. Des détails relatifs au groupement pour les variables dérivées figurent dans le dictionnaire des données sur l'immigration de la BDIM.

Un autre point à prendre en compte quant aux variables de catégories d'admission est leur relation avec le type de demandeur (variable de statut dans la famille FAMILY_STATUS du FRPN). En règle générale, les demandeurs principaux sont ceux étant évalués à l'aide des critères d'admission dans chacune des catégories, alors que le conjoint ou la conjointe et les personnes à charge qui les accompagnent sont automatiquement admis avec le demandeur principal (même si les aptitudes linguistiques du conjoint ou de la conjointe peuvent également être évaluées dans les demandes d'immigration de catégorie économique). Au sein des variables de groupement, certaines catégories d'admission précisent explicitement s'il s'agit 1) d'un demandeur principal ou 2) d'un conjoint ou d'une personne à charge, alors que pour d'autres catégories (p. ex. immigrants parrainé par la famille), il est nécessaire de se référer à la variable FAMILY_STATUS pour déterminer le statut de la personne en tant que demandeur principal ou conjoint/personnes à charge.

Deux catégories font exception à ce qui précède : la catégorie personnes à charge de type aide familial résidant et la catégorie réfugiés. Lorsqu'elles sont comparées à la catégorie de groupement de statut dans la famille FAMILY_STATUS_ROLLUP, ces variables font référence à des demandeurs principaux ainsi qu'à des personnes à charge. Cela peut se produire lorsque le demandeur principal se trouve déjà dans le pays et qu'une personne à sa charge soumet une demande distincte de résidence permanente de l'étranger. Puisque chaque demande distincte doit présenter un demandeur principal, même nominal, l'une des personnes à charge (généralement le conjoint) est considérée comme le « demandeur principal » de la demande des personnes à charge. Il n'existe, cependant, aucune différence de traitement entre les demandeurs principaux, les conjoints et les personnes à charge dans ces deux catégories d'admission.

3.4 Variables d'intérêt

La BDIM est une base de données complète fournissant aux chercheurs une myriade de variables permettant d'étudier les résultats relatifs aux caractéristiques d'immigration ainsi que diverses répercussions à long terme. Le nombre de variables au sein des fichiers de données fiscales dépasse 600 (la moitié environ au niveau individuel et l'autre moitié au niveau familial de l'agrégation). Le Fichier intégré des résidents permanents et non permanents (FRPN) contient plus de 50 variables. Même si les définitions exactes de ces variables figurent dans la composante relative à l'immigration du dictionnaire de la BDIM, certains des concepts plus nuancés sont décrits dans le présent rapport. Les sections suivantes portent sur les variables géographiques, temporelles, de scolarité et de profession envisagée, afin d'en présenter plus précisément la signification et l'utilité. De plus amples détails sur les variables de revenu figurent dans la composante relative aux impôts du dictionnaire de la BDIM. De nouvelles variables ont été ajoutées à la BDIM 2016, celles-ci comprennent les variables Mouvements d'établissement des réfugiés syriens (SYRIAN_RRW), Entrée express (EXPRESS_ENTRY_IND) et le mois et l'année de citoyenneté (CITIZEN_YEAR et CITIZEN_MONTH).

Les variables du FRPN (PNRF) font référence aux caractéristiques des immigrants lors de leur admission ou à la réception d'un document de résidence temporaire, alors que les variables des fichiers de données fiscales font référence aux caractéristiques au cours de l'année d'imposition. Alors que certaines variables sont disponibles dans les deux fichiers, les variables relatives aux impôts changent au cours du temps. L'âge, par exemple, figure dans les deux fichiers et devrait changer chaque année dans le fichier de données fiscales. L'état matrimonial des immigrants (MARITAL_STATUS) et la province de destination (DESTINATION_PROVINCE) lors de la demande de résidence permanente peuvent également différer de l'état matrimonial (MSTCO) et de la province de résidence (PRCO) au moment de la déclaration de revenus. Pour les variables qui ne devraient pas changer au cours du temps, il convient d'utiliser le FRPN par souci de cohérence.

3.4.1 Variables géographiques

La BDIM permet d'étudier la mobilité et la rétention des immigrants déclarants au Canada. Il n'est cependant pas possible de capturer complètement les émigrations, car les immigrants ou déclarants ne sont pas tenus de déclarer qu'ils quittent ou comptent quitter le pays. Les fichiers FRPN et de données fiscales présentent diverses mesures du lieu géographique qui permet aux chercheurs d'établir une destination envisagée à l'admission et les lieux de résidences suivants des immigrants. Dans le FRPN, la destination envisagée est mesurée à l'échelle provinciale, de la région métropolitaine de recensement, de la division de recensement et de la subdivision de recensement. Ces variables proviennent de la destination autodéclarée à l'admission figurant sur la demande d'immigration. Contrairement aux variables géographiques du FFT1, les variables du fichier d'établissement sont uniquement disponibles pour les géographies définies dans le dernier recensement disponible; cela signifie qu'elles ne reflètent que les limites de recensement les plus récentes.

L'autre renseignement géographique figurant sur le fichier d'établissement est la province de nomination, disponible pour les candidats des provinces. La province indiquée est celle selon les critères de laquelle le demandeur a été admis; elle ne correspond cependant pas nécessairement à la variable de province de destination.

Sous régions géographiques d'origine, les variables de pays du fichier d'établissement indiquent le pays de naissance de la personne, son pays de citoyenneté et sa résidence la plus récente au moment de son admission. Il convient de préciser que ces régions géographiques peuvent ne pas demeurer comparables au fil du temps, car les frontières nationales peuvent changer d'une année à l'autre. On peut penser par exemple à la dissolution de l'URSS, de la Yougoslavie et de la Tchécoslovaquie, à l'union du Sikkim et de l'Inde et à celle du Vietnam et du Vietnam du Nord, ou encore à la création du Soudan du Sud.

Certaines personnes indiquent dans le fichier d'établissement le Canada comme pays de naissance. Normalement, les personnes nées au Canada reçoivent cette citoyenneté à la naissance et n'ont pas à faire de demande de résidence permanente. Les personnes indiquant être nées au Canada sur le fichier d'établissement sont probablement des enfants de diplomates étrangers nés lorsqu'ils résidaient au Canada et qui ont choisi ultérieurement de demander le statut de résident permanent.

Plusieurs variables géographiques des ensembles de données du FFT1 font référence à des notions de régions géographiques légèrement différentes de celles du fichier d’établissement. Le renseignement géographique le plus détaillé du FFT1 est disponible au niveau du secteur de recensement; il est dérivé du code postal de l’adresse postale (PSCO_). Le code postal indique généralement l’adresse de résidence lors de la déclaration de revenus au printemps de l’année suivante. L’adresse postale peut également faire référence à une entreprise, comme un cabinet comptable ou d’avocats, et n’est pas nécessairement l’adresse actuelle de la personne en question. Par conséquent, la province de résidence au 31 décembre de l’année d’imposition (PRCO_) peut ne pas être identique à la province (PR__) dérivée à partir de l’adresse postale. Cette distinction est importante, car les variables dérivées de régions géographiques de recensement (ex. : RMR, SDR) peuvent ne pas correspondre à la province de résidence au 31 décembre (PRCO_); elles devraient cependant correspondre au code de province (PR__). La variable PRHO_ indique une autre valeur d’adresse postale et existe uniquement à partir de 2008. De plus, alors que la variable de code de province d’imposition (TXPCO_) est, par définition, identique à la province de résidence au 31 décembre (PRCO_), ce code de province d’imposition (TXPCO_) est moins fiable (car des problèmes connus de qualité de données concernent cette variable, pour laquelle les valeurs manquantes et celles relatives à Terre-Neuve-et-Labrador reçoivent le code « 0 »). Pour de plus amples renseignements sur la qualité des variables géographiques, veuillez consulter la section 7.6.

Utiliser les variables des fichiers de données fiscales pour étudier la mobilité géographique des immigrants exige de tenir attentivement compte du moment en question avant de déduire un déménagement et l'emplacement de travail. Un guide du chercheur portant sur l'étude de la mobilité et de la présence est inclus en annexe D.

3.4.2 Variables temporelles

L'« année d'admission » et l'« année d'imposition » sont des variables temporelles souvent utilisées pour produire des tableaux et effectuer des analyses à l'aide de la BDIM. L'année d'admission est l'année où l'immigrant a reçu le statut de résident permanent, alors que l'année d'imposition est l'année pour laquelle la déclaration de revenus est produite.

Il est recommandé de considérer la première année de revenu comme l'« année d'admission + 1 », puisqu'il s'agit de la première année complète où la personne se trouvera dans le pays. Il convient d'interpréter avec précaution les revenus déclarés pour l'année d'admission. Tout d'abord, environ 50 % de chaque cohorte d'admission produisent une première déclaration de revenus pour l'année d'admission (proportion calculée en fonction des déclarants à partir des immigrants couplés). Ensuite, les revenus déclarés l'année d'admission peuvent ne pas représenter une année de revenus complète. Une personne admise en octobre 2010 déclarera, au printemps 2011, des revenus pour seulement 3 mois, alors qu'une personne admise en janvier 2010 déclarera des revenus pour 12 mois.

Des déclarations de revenus sont également possibles après le décès d'une personne, lorsqu'une personne apparentée au décédé produit une déclaration de revenus en son nom. La variable de type de famille (FCMP_) du FFT1 doit être utilisée dans ce cas. Veuillez consulter le dictionnaire des données pour plus de précisions.

Le tableau 1 illustre, par exemple, les scénarios possibles et décrit les enregistrements à inclure dans une étude visant à évaluer les résultats socioéconomiques de la cohorte des immigrants de 1995 à 2000, cinq ans après leur admission. Pour qu'un enregistrement soit inclus, l'immigrant doit avoir été admis entre 1995 et 2000 et avoir produit une déclaration de revenus cinq ans après son admission. Cette analyse inclurait les enregistrements de la BDIM suivants : IM19952 et IM19963.

Tableau 1
Exemple de définition d'une cohorte d'intérêt
Sommaire du tableau
Le tableau montre les résultats de Exemple de définition d'une cohorte d'intérêt. Les données sont présentées selon IMDB_ID (titres de rangée) et Année d'admission, Années d'imposition disponibles et Inclus dans le champ d'enquête (figurant comme en-tête de colonne).
IMDB_ID	Année d'admission	Années d'imposition disponibles	Inclus dans le champ d'enquête
IM19801	1980	1982 à 2013	Non; admis avant 1995
IM19952	1995	1988 à 2011	Oui
IM19963	1996	1996 à 2013	Oui
IM19974	1997	2010 à 2013	Oui, mais pas de fichiers de données fiscales disponibles cinq ans après l'admission
IM20095	2009	2011 à 2013	Non; admis après 2000
Note : Cet exemple se fonde sur des données fictives. Source : Statistique Canada, exemple provenant de la base de données longitudinales sur l'immigration.

L'un des inconvénients d'utiliser les données fiscales administratives est leur manque de précision quant aux dates. Outre l'année pour laquelle les revenus sont déclarés, aucune variable de temps n'existe dans le FFT1. Cela présente des difficultés pour étudier les durées d'emploi et de chômage, le moment des déménagements et les dates de mariage. Cette lacune ne permet pas non plus de distinguer facilement les travailleurs autonomes qui sont également des employés saisonniers de ceux qui reçoivent un revenu simultanément de deux sources. Malgré ces limites, il est tout de même possible de prendre des décisions en matière de date en tenant compte des points suivants.

Puisque les revenus de l'année précédente sont généralement déclarés au printemps de l'année civile suivante, une incertitude peut exister quant à l'année précise d'un changement d'adresse. Une personne A, par exemple, pourrait déclarer ses revenus de 2011 avec une adresse postale à Toronto, puis déclarer ses revenus de 2012 avec une adresse postale à Ottawa. On peut en déduire que cette personne A vivait à Toronto lors de sa déclaration de revenus de 2011 au printemps 2012 et vivait à Ottawa au printemps 2013. La personne A a pu déménager en 2012, après avoir produit sa déclaration de revenus pour l'année précédente, ou au cours des premiers mois de 2013, avant de produire sa déclaration de revenus pour 2012. Si cette personne A a changé de province, la variable de la province de résidence au 31 décembre (PRCO_) pourrait être utile pour déduire l'année du déménagement, puisqu'elle porte sur la province de résidence de cette personne en décembre de l'année d'imposition. L'adresse postale ne correspond pas nécessairement au lieu de résidence.

3.4.3 Variables relatives à la scolarité

Plusieurs variables du fichier d'établissement, comme les années d'études et le niveau de scolarité, permettent de mesurer le niveau de scolarité à l'admission. La première prend la forme d'une réponse écrite à la question « Combien d'années d'études avez-vous terminées? » La deuxième est un choix parmi des options correspondant au niveau de scolarité le plus élevé atteint. La variable de « niveau de scolarité » dérivée combine les renseignements provenant de ces deux questions.

Des problèmes de qualité des données a été relevé pour ces variables relatives à la scolarité depuis 2011. Par exemple, une proportion significative des personnes pour cette période n'ont pas précisé leur niveau de scolarité ou leur nombre d'années d'études; le code « 0 » (« aucun ») a été attribué à ces variables EDUCATION_QUALIFICATIONS et YEARS_OF_SCHOOLING plutôt que « donnée manquante ». En 2011, jusqu'à 35 % des immigrants ont indiqué ne pas avoir suivi d'études, par rapport à environ 10 % dans les années 1990. Les variables relatives à la scolarité de 2011 à 2017 ont fait l'objet d'une imputation pour résoudre ce problème. Si vous souhaitez davantage de détails sur l'imputation, consultez la section 7.3.

3.4.4 Variables de profession envisagée

IRCC recueille la profession envisagée à partir de l'enregistrement d'admission et lui attribue une classification correspondant aux codes de 2011 Classification nationale des professions (CNP) du fichier d'établissement. Il s'agit de la classification la plus large en matière de compétences; les codes CNP à cinq chiffres étant les plus précis (voir le dictionnaire en annexe pour des définitions complètes).

Même si la profession envisagée est également considérée comme un remplacement valable de la profession de la personne dans son pays d'origine, des précautions sont recommandées. Pour pouvoir indiquer une profession envisagée, le demandeur doit démontrer qu'il possède les qualifications requises en matière d'études ainsi qu'au moins une année d'expérience dans le domaine. IRCC considère, par conséquent, ce renseignement comme une mesure prudente de la variable envisagée après l'admission, puisque les exigences qui l'accompagnent sont relativement strictes. Les étudiants venant d'obtenir un diplôme de génie, par exemple, ne peuvent pas indiquer « ingénieur » comme profession envisagée (du fait de leur manque d'expérience professionnelle) et sont plutôt classés comme « étudiants ». D'autres variables, comme l'intention sur le marché du travail (LM_INTENTION) et le niveau de compétence (SKILL_LEVEL), peuvent servir à obtenir des renseignements sur le domaine professionnel de la personne dans son pays d'origine. Il convient, en outre, de souligner que le champ de profession envisagée est obligatoire pour les immigrants demandeurs principaux au sein des catégories économiques. Pour les autres immigrants, ce renseignement pourrait être une mesure moins fiable de la profession envisagée.

3.4.5 Autres variables de la BDIM

Seules les variables nécessitant une explication détaillée et présentant d'éventuelles difficultés importantes pour les analystes ont été incluses à la section 3.4. Pour de plus amples détails sur les variables incluses dans la BDIM, veuillez vous reporter aux dictionnaires de la BDIM. La composante relative aux impôts décrit les variables incluses dans les fichiers IMDB_T1FF, alors que la composante relative à l'immigration décrit les variables incluses dans les autres fichiers. Ces dictionnaires sont à la disposition des utilisateurs des données, mais il est également possible de les obtenir en en faisant la demande par écrit à Statistique Canada à l'adresse STATCAN.infostats-infostats.STATCAN@canada.ca.

Les utilisateurs des données de la BDIM doivent garder à l'esprit que les données des fichiers relatifs à l'immigration et de données fiscales sont recueillies à divers moments et que, dans certains cas, les caractéristiques des personnes évoluent au cours du temps. Par conséquent, l'état matrimonial et la composition de la famille d'une personne peuvent changer au cours de l'année et différer entre le FRPN et le FFT1. Les variables à utiliser dans l'analyse dépendent de l'objet de l'étude.

4 Couplage d'enregistrements^{Note 7}

Comme le décrit le présent document, la BDIM est le produit de nombreux couplages d'enregistrements. Elle a été créée en vue de fournir des renseignements statistiques anonymes. Cette section fournit un aperçu des méthodes de couplage d'enregistrements utilisées pour créer la BDIM. Pour de plus amples détails sur le traitement des données relatif au couplage d'enregistrements, reportez-vous à la section 5.

Le couplage d'enregistrements est le processus de mise en correspondance d'enregistrements entre ou au sein de bases de données. Cette approche est couramment utilisée pour combler des lacunes statistiques et créer un ensemble de données présentant de vastes applications (Rotermann et coll., 2015).

Pour produire la BDIM, l'Environnement de couplage de données sociales (ECDS) a été utilisé. Il s'agit d'un environnement de couplage très sécurisé qui facilite la création de fichiers de données couplés sur la population pour l'analyse sociale.

Au centre de l'ECDS se trouve le Dépôt d'enregistrements dérivés (DED ou Dépôt), une base de données relationnelle dynamique nationale renfermant seulement des identificateurs personnels de base. Le DED est créé en couplant différents fichiers index sources de Statistique Canada dans le but de produire une liste de particuliers. Ces fichiers, qui renferment des identificateurs personnels sans variables d'analyse, sont intégrés à l'environnement, traités et couplés seulement une seule fois au DED. Les mises à jour de ces fichiers de données sont couplées au DED de façon régulière.

En 2018, le taux de couplage au dépôt pour les immigrants admis était de 97,6 % (Cascagnette, 2018) et la méthode probabiliste a été utilisée pour coupler les données sur l'immigration d'IRCC aux données fiscales de l'ARC. Pour effectuer le couplage d'enregistrements, Le système généralisé de couplage d'enregistrement G-Coup a été utilisé.

Le système généralisé de couplage d'enregistrements qu'utilise Statistique Canada, G-Coup, se fonde sur la théorie mathématique du couplage d'enregistrements élaborée par Ivan P. Fellegi et Alan B. Sunter. La méthodologie de couplage d'enregistrements probabiliste compare des identificateurs non uniques (p. ex. nom et date de naissance) et estime la probabilité que les enregistrements correspondants portent sur la même entité (p. ex. personne). Le couplage d'enregistrements probabiliste s'avère particulièrement utile lorsque les identificateurs sont susceptibles de changer (p. ex. nom de famille des femmes qui se marient), peuvent comporter des erreurs et sont souvent absents.

La comparaison des enregistrements est faite champ par champ au moyen de règles de comparaison dont les niveaux de concordance sont correspondance exacte, proximité des chaînes, information manquante ou non-concordance entre les champs. Un niveau de concordance est produit pour chaque règle en fonction de la similitude des valeurs d'une paire d'enregistrements. Un modèle de comparaison des résultats est attribué à chaque paire d'enregistrements. Ce modèle est évalué afin de classer les paires comme étant liées, possiblement liées ou non liées.

La théorie du couplage d'enregistrements probabiliste se fonde sur la prémisse selon laquelle les résultats de certains modèles de comparaison des résultats sont caractéristiques de paires véritablement couplées, tandis que d'autres sont caractéristiques de paires véritablement non couplées. Ainsi, un poids est attribué à chaque niveau de concordance d'une règle en fonction du ratio de la probabilité estimée que le niveau de concordance soit obtenu pour les correspondances véritables à la probabilité estimée que le niveau soit obtenu pour les non-correspondances.

Comme on ne connaît pas d'avance la composition de l'ensemble couplé, on ne connaît pas les probabilités des modèles de résultats pour les enregistrements véritablement couplés. Les composantes de poids couplées sont estimées à partir de connaissances antérieures et de versions antérieures du processus de couplage. Elles sont précisées lors d'itérations successives du processus de couplage.

Les composantes de poids non couplées sont calculées en fonction de la fréquence à laquelle les niveaux d'une règle ont été observés parmi des paires d'enregistrements qui ne vont pas ensemble, ce qui équivaut approximativement à la fréquence à laquelle les niveaux d'une règle seraient observés parmi des enregistrements associés de manière aléatoire. Après une itération répétée du processus de couplage, les composantes de poids couplées se stabilisent, et il est possible d'utiliser les poids finaux.

La stratégie du couplage d'enregistrements probabiliste comporte les six étapes suivantes :

Produire des paires potentielles au moyen d'un critère initial.
Créer des règles de comparaison et les appliquer aux paires potentielles pour obtenir des ratios de probabilité.
Appliquer des poids de fréquence.
Affecter des états de couplage aux paires au moyen de ratios de probabilité et de seuils.
Former des groupes.
Résoudre les conflits au moyen de la mise en correspondance.

Il faut répéter les étapes 2 à 4 de manière itérative. Chaque étape est décrite de manière plus détaillée ci-dessous.

Les utilisateurs d'un ensemble de données créé à partir d'un couplage d'enregistrements doivent être conscients que des erreurs de couplage sont possibles. Un couplage d'enregistrements peut produire quatre résultats : de réelles correspondances correctement classées comme des correspondances, de réelles correspondances classées à tort comme des non-correspondances, de réelles non-correspondances classées à tort comme des correspondances ou de réelles non-correspondances correctement classées comme des non-correspondances (Winkler, 2009). Ainsi que le montre l'exemple du tableau 2, dans lequel les enregistrements du fichier 1 sont couplés aux enregistrements du fichier 2, le résultat du couplage d'enregistrements entre deux variables sera soit une correspondance soit une non-correspondance. Un bon couplage d'enregistrements maximisera la proportion des réelles correspondances correctement classées comme des correspondances et la proportion des réelles non-correspondances correctement classées comme des non-correspondances, et minimisera les autres résultats éventuels du couplage d'enregistrements.

Tableau 2
Exemple de résultats de couplage d'enregistrements
Sommaire du tableau
Le tableau montre les résultats de Exemple de résultats de couplage d'enregistrements. Enregistrement, Fichier 2 et Type de résultat (figurant comme en-tête de colonne).
	Enregistrement	A	B	D	Type de résultat
	Enregistrement	Fichier 2			Type de résultat
Fichier 1	A	Correspondance	Non-correspondance	Non-correspondance	Réelle correspondance
	C	Non-correspondance	Correspondance	Non-correspondance	Fausse correspondance
	D	Non-correspondance	Non-correspondance	Non-correspondance	Fausse correspondance
	E	Non-correspondance	Non-correspondance	Non-correspondance	Réelle correspondance
Source : Statistique Canada, exemple de résultats de couplage d'enregistrements.

Les résultats d'un couplage d'enregistrements probabiliste dépendent de la qualité des variables de couplage. Des noms mal orthographiés, par exemple, ou des coquilles dans la date de naissance peuvent empêcher des correspondances ou créer des erreurs de correspondance. Une non-correspondance ne signifie pas nécessairement que la personne n'a pas produit de déclaration de revenus. Les taux de couplage d'enregistrements pour la BDIM la plus récente sont fournis à la section 7.2.1.

5 Traitement des données

5.1 Traitement

Plusieurs organismes gouvernementaux participent à la création et au traitement de la BDIM. De la collecte initiale des données à la diffusion en passant par le traitement, la coopération de ces organismes est nécessaire pour fournir la qualité élevée des données qu'attentent les utilisateurs des données de Statistique Canada. À chaque étape de la séquence de traitement, des vérifications attentives, manuelles et automatiques, de la qualité des données sont effectuées et des boucles de rétroaction servent à corriger toute erreur détectée à la source. La section suivante décrit brièvement le processus annuel de traitement qui permet de mettre la BDIM à jour.

Figure 1 Résumé du déroulement du processus de création de la BDIM

Description de la figure 1

La figure 1 est un résumé du déroulement du processus de création de la BDIM. Des fichiers d'entrée sont reçus. Des données sur l'immigration, précisément le fichier des immigrants reçus, le fichier des résidents non permanents et le fichier des citoyenneté, sont reçus du Ministère IRCC. Des données fiscales, précisément le fichier T1, le fichier de la Prestation fiscale canadienne pour enfants (PFCE) et le fichier T4, sont reçus de l'ARC. Après la réception des fichiers, des couplages d'enregistrements à partir de l'Environnement de couplage de données sociales (ECDS) sont faits pour identifier les déclarants fiscaux. Puis, les fichiers finaux de la Base de données longitudinales sur l'immigration (BDIM) sont produits. À partir des données sur l'immigration, le PNRF, PNRF_Nonfilers, PNRF_extra, NRF_Permit et NRF_permit sont créés. À partir des données fiscales, les T1FF sont créés pour les années 1982 à 2016. Note : Voir le glossaire pour connaître les définitions des acronymes. La source de cette figure est Statistique Canada.

Comme le montre la figure 1 (les fichiers finaux sont nommés avec l'acronyme anglais dans la BDIM), Statistique Canada reçoit d'abord les données de T1 de l'Agence du revenu du Canada (ARC), dans un fichier intitulé « Fichier maître des particuliers » et d'autres fichiers de données fiscales. Les fichiers de données fiscales servent alors à créer le FFT1, au sein duquel les personnes sont couplées à leurs conjoints et enfants par un identificateur commun et des variables géographiques sont créées. Statistique Canada effectue des vérifications manuelles de la qualité et compare les estimations du FFT1 à d'autres sources de données, comme le recensement (pour les années de recensement) et l'Enquête sur la dynamique du travail et du revenu, ainsi que des statistiques de revenu annuel que produit l'ARC^{Note 8}.

En matière d'immigration, IRCC fournit les données relatives aux immigrants admis, aux résidents non permanents et citoyens qui sont utilisées pour produire la BDIM. Ces données servent à créer le Fichier des immigrants reçus (FIR) et le Fichier des résidents non permanents (FRN). On considère que les fichiers FIR et FRN sont des recensements complets des permis de résidence permanente et temporaire qu'a délivrés IRCC depuis 1980.

Outre l'ajout des renseignements de l'année d'imposition la plus récente, une vérification complète des années précédentes a lieu afin d'ajouter des données fiscales pour toute nouvelle personne couplée. Cela peut signifier que les enregistrements de déclaration de revenus d'un immigrant admis ou d'un résident non permanent peuvent ne pas être couplés dans la BDIM une certaine année, mais que ses déclarations de revenus suivantes peuvent être couplées pour une année ultérieure. À mesure que la méthodologie s'améliore, la vérification rétroactive peut permettre de coupler également toutes ses déclarations de revenus antérieures, si elles figurent dans le FFT1. C'est ainsi qu'après le traitement des données fiscales les plus récentes, des personnes admises et ayant produit une déclaration de revenus plusieurs années auparavant peuvent encore être ajoutées à la BDIM. Lorsque plusieurs admissions depuis 1980 existent pour une personne, on conserve les données de sa première admission.

Bien que les déclarations de revenus d'une année donnée soient généralement produites au printemps de l'année suivante (p. ex. déclaration des revenus de 2013 en 2014), des exceptions existent. Parfois, une personne produit sa déclaration de revenus plus tard dans l'année et n'est alors pas incluse dans le traitement des T1 qu'effectue Statistique Canada pour cette année-là. Lorsque ce fichier est transmis aux fins de traitement pour la BDIM, ces déclarants retardataires ne sont pas inclus et ne le seront pas non plus lors du traitement de l'année suivante, puisque le FFT1 n'est pas mis à jour. De la même manière, les personnes qui produisent leur déclaration de revenus pour des années antérieures ne sont pas ajoutées à la BDIM pour ces années, puisque les FFT1 des années précédentes ne sont pas mis à jour. Dans ces cas, la première déclaration de ces personnes effectuée au moment attendu s'affichera comme leur première année dans la base de données.

Pour l'instant, on exécute une série de programmes pour évaluer la qualité des données et les taux de couplage, afin d'éviter tout doublon et de signaler les valeurs aberrantes. Une fois la base de données couplée, elle est jugée complète et prête à être mise à disposition.

Finalement, la base de données consiste en des fichiers SAS, un fichier de données fiscales par année depuis 1982 (IMDB_T1FF_&year) et des fichiers sur les données relatives à l'immigration (PNRF_&year, PNRF_EXTRA_&year et NRF_PERMIT_&year). Tous ces fichiers sont décrits dans la section 2. L'identificateur personnel unique de la BDIM (IMDB_ID) sert à relier tous ces fichiers (voir l'annexe D.1 pour des conseils de programmation).

5.2 Couplage du Fichier des résidents non permanents (FRN)

Le Fichier des résidents non permanents (FRN) qu'IRCC fournit couvre les enregistrements de permis de résidence temporaire délivrés à partir de 1980. Il fournit des données démographiques sur les résidents non permanents ainsi que des renseignements détaillés sur leur permis, tels que le type de permis et leur plage de validité.

Le FRN contient des millions d'observations. Elles comprennent cependant des doublons, selon lesquels une même personne peut compter plusieurs identifiants différents. Le problème provient principalement d'enregistrements à la fin des années 1980 pour lesquels le numéro d'identification de la personne initiale a été perdu. Ces enregistrements ont été supprimés en couplant le FRN à lui-même. Cela a permis de déterminer qu'environ 220 000 enregistrements (environ 400 000 observations) étaient des doublons. Dans les cas où les deux enregistrements de résidents non permanents possédaient chacun un enregistrement d'admission, le lien de doublon a été supprimé (ce qui s'applique à moins de 1 000 enregistrements), puisqu'on considère que le fichier d'établissement contient des identifiants uniques. Après nettoyage, il ne reste que des résidents non permanents distincts.

Les deux fichiers relatifs à l'immigration (FIR et FRN) contiennent des données démographiques. Toutefois, ces données démographiques ne sont pas toujours cohérentes. Cela se produit lorsque plusieurs sources sont disponibles ou en cas de conflit. Il a été décidé que les données du FIR relatives au Fichier intégré des résidents permanents et non permanents (FRPN) seraient conservées, du fait de problèmes de qualité concernant les données du FNR au cours de ses premières années.

5.3 Variables dérivées incluses dans le FFT1

Une fois les couplages d'enregistrements effectués, on ajoute au FFT1 des variables relatives à l'immigration pour les immigrants et les résidents temporaires.

On crée un indicateur de statut d'immigrant pour les déclarants en fonction du couplage avec les données sur l'immigration d'IRCC. Pour déterminer si une déclaration de revenus correspond à un déclarant qui était un résident non permanent, on utilise l'indicateur TR_IND (1 : oui; 0 : non).

Des variables dérivées indiquant et décrivant des familles sont également créées. Dans chaque FFT1 annuel, il est possible d'estimer le nombre d'immigrants dans une famille admise depuis 1980 (variable IMM80F&year). Cependant, ceci peut être une sous-estimation car cette variable inclut seulement les déclarants et non les enregistrements imputés, donc les enfants sont sous-estimés. Il est également possible de déterminer si l'immigrant est un conjoint (pour l'année d'imposition donnée) et si ce conjoint est immigrant ou résident non permanent (variable SP_IDI&year). Les utilisateurs de données peuvent recenser les immigrants d'une même famille, pour chaque année d'imposition, à l'aide de la variable de numéro d'identification de la famille (FIN_). Cette variable présente la même valeur pour tous les membres d'une famille, c'est-à-dire l'identifiant IMDB_ID du membre de la famille le plus âgé admis depuis 1980. La qualité de ces variables dépend de la qualité du couplage d'enregistrements et des fichiers FFT1, puisque seules les personnes couplées sont comptabilisées (voir la section 7.5).

Les variables ayant le préfixe TNK représentent le nombre d'enfants déclarés d'un certain âge dans les familles d'immigrants et de résidents non permanents (voir la composante relative aux impôts du dictionnaire des données pour de plus amples détails). Le terme « enfant » désigne toute personne célibataire vivant avec un ou deux parents; un enfant peut être de tout âge. Au tableau 3, par exemple, la famille d'immigrants dont le numéro est IM19801 a deux enfants de 1 an en 2011 (TNK01I2011), alors que la famille IM19873 a trois enfants en 2011 (TNKIDI2011), un de 0 an (TNK00I2011), un de 1 an (TNK01I2011) et un de plus de 18 ans (TNK19I2011). L'immigrant IM20105 n'a pas d'enfant en 2011.

Tableau 3
Exemple de variables relatives au nombre d'enfants dans une famille
Sommaire du tableau
Le tableau montre les résultats de Exemple de variables relatives au nombre d'enfants dans une famille. Les données sont présentées selon IMDB_ID (titres de rangée) et TNK00I2011, TNK01I2011, TNKxxI2011, TNK19I2011 et TNKIDI2011, calculées selon nombre unités de mesure (figurant comme en-tête de colonne).
IMDB_ID	TNK00I2011	TNK01I2011	TNKxxI2011	TNK19I2011	TNKIDI2011
IMDB_ID	nombre
IM19801	0	2	0	0	2
IM19802	0	1	0	0	1
IM19873	1	1	0	1	3
IM19994	0	0	0	1	1
IM20105	0	0	0	0	0
Note : Toutes les variables ne figurent pas dans ce tableau. Cet exemple se fonde sur des données fictives. Source : Statistique Canada, exemple provenant de la base de données longitudinales sur l'immigration.

Une autre variable ajoutée au FFT1 est l'identificateur de valeur aberrante OUTLIER_IND (1 : aberrante; 0 : non). Il s'agit d'un indicateur ajouté pour détecter les enregistrements présentant des résultats extrêmes (voir la section 5.5 pour de plus amples détails) et devant être supprimés de tout tableau ou calcul. Les enregistrements marqués comme aberrants présentent des revenus extrêmes qui ajouteraient un biais aux résultats de l'analyse.

5.4 Variables dérivées incluses dans le FRPN

Lorsque le FRPN est produit, certaines variables relatives aux tendances de déclaration de revenus sont dérivées et incluses au fichier. La variable FIRST_TAX_YEAR indique la première année pour laquelle les données fiscales sont disponibles pour une personne donnée, alors que la variable LAST_TAX_YEAR indique la dernière année pour laquelle les données fiscales sont disponibles. Il convient de noter que des données fiscales ne sont pas nécessairement disponibles chaque année entre la première et la dernière année d'imposition. Par exemple, un cas où les variables First_tax_year=1982 et Last_tax_year=2012 existent ne signifie pas nécessairement que le déclarant a produit une déclaration de revenus de manière continue; les données fiscales pour 2006 peuvent manquer, par exemple.

La variable de déclarant avant l'admission PREFILER_IND sert à signaler les immigrants pour lesquels des données existent dans le FFT1 avant leur année d'admission. La plupart de ces cas ont été couplés à des enregistrements de résidents non permanents, comme on s'y attend (voir la section 7.2.4 pour de plus amples détails).

5.5 Détection des valeurs aberrantes

Après la création des fichiers IMDB_T1FF, on procède à la détection des valeurs aberrantes dans tous les fichiers de données fiscales, afin de relever tous les enregistrements aberrants. Un enregistrement est jugé aberrant lorsque l'on détermine qu'il contient une valeur ou plus de revenus extrême par rapport aux autres enregistrements. Les critères utilisés pour déterminer les valeurs aberrantes sont confidentiels. La variable OUTLIER_IND est créée pour recenser les enregistrements présentant des valeurs extrêmes.

L'indicateur de valeur aberrante OUTLIER_IND figure dans les fichiers de données fiscales, mais non dans le FRPN. Cet indicateur peut être attribué à l'enregistrement d'une personne donnée pour une année particulière, sans que cela ne soit nécessairement le cas pour toutes les années pour lesquelles la personne a produit une déclaration de revenus. Toutes les valeurs aberrantes doivent être supprimées de toute analyse. Comme le montre le tableau 4, pour la personne IM19802, l'indicateur de valeur aberrante a seulement été attribué à l'enregistrement de 1983, alors qu'aucun des fichiers de données fiscales de la personne IM19801 ne présente cet indicateur. Aucun indicateur de valeur aberrante n'apparaît en 2012 pour la personne IM19994, car aucune donnée fiscale n'est disponible pour cette personne cette année-là.

Tableau 4
Exemple relatif à l'indicateur de valeur aberrante
Sommaire du tableau
Le tableau montre les résultats de Exemple relatif à l'indicateur de valeur aberrante. Les données sont présentées selon IMDB_ID (titres de rangée) et OUTLIER_IND1982, OUTLIER_IND1983, OUTLIER_INDyyyy, OUTLIER_IND2012 et OUTLIER_IND2014 (figurant comme en-tête de colonne).
IMDB_ID	OUTLIER_IND1982	OUTLIER_IND1983	OUTLIER_INDyyyy	OUTLIER_IND2012	OUTLIER_IND2014
IM19801	0	0	0	0	0
IM19802	0	1	0	0	0
IM19873	1	1	1	0	Note ...: n'ayant pas lieu de figurer
IM19994	0	0	0	Note ...: n'ayant pas lieu de figurer	0
... n'ayant pas lieu de figurer Note : Toutes les variables ne figurent pas dans ce tableau. Cet exemple se fonde sur des données fictives. Source : Statistique Canada, exemple provenant de la base de données longitudinales sur l'immigration.

Les valeurs aberrantes sont supprimées des totalisations et de toute analyse. La BDIM exclut (les très rares) revenus importants, car ils influeraient sur les moyennes et donneraient une impression incorrecte de la situation en matière de revenus pour certains types d'immigrants. Prenons l'exemple fictif d'un revenu moyen de 40 000 $ pour les Canadiens tchèques pour une année donnée; l'année suivante, cette moyenne atteint subitement 500 000 $ parce qu'un joueur de hockey tchèque a été admis. Cela inclurait un biais dans la situation « réelle » des Canadiens tchèques en matière de revenus. Ainsi, le revenu « non représentatif » du joueur de hockey tchèque serait retiré des calculs. De plus, cet exemple présente une composante de confidentialité. Si une telle hausse du revenu était observée, il serait possible de déduire le revenu du joueur de hockey; ce qui constituerait une atteinte à la vie privée. Dans certains produits de la BDIM, le revenu médian, qui résiste mieux à l'influence d'importantes valeurs individuelles, est également fourni.

Lorsqu'une personne produit des tableaux ou analyse des données, les enregistrements jugés être des valeurs aberrantes pour une année donnée doivent être retirés des calculs pour l'année en question pour les raisons susmentionnées. Pour de plus amples détails, voir l'annexe D.6.

6 Diffusion

Une fois le couplage terminé, les fichiers de données (voir la section 6.3) sont enregistrés sur les serveurs de Statistique Canada, afin que les utilisateurs de données puissent créer des tableaux et des modèles à partir des résultats. Statistique Canada diffuse les résultats au moyen de produits tabulaires et analytiques, tout en respectant strictement les normes de confidentialité des données. Les utilisateurs souhaitant des renseignements ne figurant que sur le Fichier des immigrants reçus (FIR) devraient s'adresser à IRCC, puisque la BDIM ne présente que des données sur les immigrants déclarants. Les membres des centres de données de recherche ont accès aux fichiers de micro données (voir section 6.2).

6.1 Produits analytiques

Statistique Canada utilise un répertoire commun des données de diffusion pour les données en ligne. Ce répertoire de données comprend des tableaux qui présentent le revenu des immigrants selon diverses caractéristiques individuelles et géographiques. À partir de la page principale du moteur de recherche des données du site Web de Statistique Canada, on peut accéder aux tableaux de la BDIM en sélectionnant « Immigration et diversité ethnoculturelle », « Immigrants et résidents non permanents », puis « Base de données longitudinales sur l'immigration » sous « Enquête ou programme statistique ». Il est à noter que Statistique Canada a remplacé les tableaux du Système canadien de gestion de l'information socioéconomique (CANSIM) par ce répertoire commun de données en juin 2018. Les données de la BDIM qui étaient auparavant disponibles par l'entremise de CANSIM y sont désormais accessibles. Les mises à jour annuelles de la BDIM sont indépendantes les unes des autres. D'année en année, il peut y avoir des changements aux processus de création des données. Les mesures du revenu (moyennes et médianes) disponibles dans les tableaux sont les salaires, les traitements et les commissions, l'assurance-emploi, les revenus de placement, les revenus de travail indépendant et les prestations d'aide sociale (pour plus de détails sur la façon dont ces mesures sont calculées, voir l'annexe D.8).

En 2016, quatre tableaux fondés sur les données de la BDIM ont été produits à l'échelle provinciale et nationale, les revenus sont en dollars constant de 2016 :

Tableau 1 (43-10-0009) : Revenu des immigrants selon le sexe, la catégorie d'admission, le groupe d'âge à l'admission, les années depuis l'admission et l'année d'admission;

Tableau 2 (43-10-0010) : Revenu des immigrants selon le sexe, la catégorie d'admission, l'expérience pré-migratoire, les années depuis l'admission et l'année d'admission;

Tableau 3 (43-10-0011) : Revenu des immigrants selon le sexe, la catégorie d'admission, l'expérience pré-migratoire, la région du monde, la connaissance des langues officielles, l'année d'admission, pour l'année de d'imposition 2016;

Tableau 4 (43-10-0012) : Mesure de mobilité des immigrants selon le sexe, la catégorie d'admission, l'expérience pré-migratoire, l'année d'admission et l'année d'imposition.

Tous les tableaux présentent le détail selon la province de résidence. Les provinces atlantiques sont regroupées en une seule catégorie, à l'exception du tableau 4. La valeur de la province se fonde sur la province de résidence au 31 décembre de l'année d'imposition (variable PRCO).

Plusieurs articles analytiques relatifs à la BDIM ont en outre été publiés au cours des années (voir l'annexe C). Les analystes de Statistique Canada acceptent, en outre, des demandes de données ponctuelles de chercheurs et d'utilisateurs de données. Ils y répondent selon une formule de recouvrement des coûts.

6.2 Demande de fichiers analytiques

Une fois la BDIM publiée, tous les fichiers analytiques décrits dans le présent rapport (PNRF, PNRF_nonfilers, PNRF_extra, IMDB_T1FF, NRF_person et NRF_permit) sont également mis à la disposition des chercheurs sur place, qui obtiennent un droit d'accès lorsqu'ils reçoivent le statut de personne réputée être employée de Statistique Canada. Tout renseignement permettant l'identification est supprimé de ces microdonnées individuelles (comme une date de naissance exacte, la date d'admission, le numéro d'assurance sociale et le nom). Les chercheurs qui ne peuvent se rendre physiquement au bureau central de Statistique Canada peuvent accéder aux fichiers dans les centres de données de recherche (CDR) à travers le pays. Les centres de données de recherche permettent aux chercheurs un accès à de nombreuses enquêtes sur la population et les ménages, ainsi qu'aux données administratives, dans un environnement sécurisé au sein des universités. Les utilisateurs de la BDIM peuvent demander des totalisations personnalisées à Statistique Canada; ces demandes sont traitées selon une formule de recouvrement des coûts et ces coûts peuvent varier selon la nature et le type de chaque demande.

Avant la parution de tout résultat, Statistique Canada en vérifie la confidentialité. Des exigences de taille de cellule minimale et l'arrondissement limitent les risques d'atteinte à la vie privée.

6.3 Autres programmes statistiques utilisant les données de la BDIM

Les données de la BDIM sont utilisées à diverses fins dans le cadre de nombreux programmes de Statistique Canada. La Banque de données administratives longitudinales (DAL) inclut dans son échantillon un échantillon de 20 % des enregistrements de la BDIM. La DAL utilise également les enregistrements de la BDIM pour ajouter des variables propres aux immigrants (comme l'année d'admission) à sa banque de données.

La Base de données canadienne sur la dynamique employeurs-employés (BDCDEE) est un ensemble de fichiers de données analytiques longitudinales que Statistique Canada maintient à jour pour fournir des correspondances de données entre employés et employeurs du marché du travail canadien depuis l'an 2001. Les fichiers de la BDCDEE couvrent toutes les personnes dont l'identité peut être établie dans les fichiers T1 et T4, ainsi que les renseignements sur les employeurs ou tout travail autonome auxquels les personnes peuvent être reliées. La BDIM est l'un des fichiers composant la BDCDEE et ce couplage permet aux chercheurs d'effectuer une analyse de la situation sur le marché du travail et des dynamiques de l'emploi relativement à la population immigrante au Canada.

L'Enquête sociale générale (ESG) de 2013 sur l'identité sociale (IS) recueille des renseignements détaillés sur les réseaux sociaux, ainsi que sur la participation et l'engagement civiques de la population canadienne. L'ESG de 2013 sur l'identité sociale a été couplée à la BDIM dans le but de sélectionner un échantillon représentatif de la population immigrante, afin de soutenir et d'évaluer les politiques et programmes relatifs aux immigrants. Immigration, Réfugiés et Citoyenneté Canada (IRCC) a en particulier utilisé ce fichier de données couplées pour élaborer un profil descriptif des relations sociales et de l'engagement civique des immigrants selon les catégories d'admission.

DEMOSIM^{Note 9}, modèle de microsimulation de Statistique Canada, utilise le fichier BDIM-DAL pour créer des projections de population pour les provinces, territoires, régions métropolitaines de recensement et certains découpages géographiques moins étendus, selon plusieurs caractéristiques. Les programmes de recensement ont recours à la base de données pour attester les données sur l'immigration.

La BDIM a été appariée à plusieurs enquêtes, notamment l'Enquête Longitudinale sur les Immigrants au Canada (ÉLIC), l'Étude Longitudinale et Internationale des Adultes (ELIA), et l'Enquête sur la Santé dans les Collectivités Canadiennes (ESCC). Suite à l'intégration de la BDIM dans l'ECDS d'autres programmes statistiques seront appariées à l'avenir.

6.4 Confidentialité^{Note 10}

Statistique Canada s'est engagé à assurer la protection des renseignements personnels. Tous les renseignements personnels créés, détenus ou recueillis par Statistique Canada sont protégés par la Loi sur la protection des renseignements personnels et par la Loi sur la statistique dans le cas des répondants à nos enquêtes.

Du fait de son mandat unique à titre d'agence statistique nationale de collecte de renseignements personnels aux seules fins d'études statistiques et de recherche, Statistique Canada a préparé des évaluations des facteurs relatifs à la vie privée qui portent sur les problèmes de protection de la vie privée associés aux activités d'enquête.

Statistique Canada a mis en place une évaluation des facteurs relatifs à la vie privée^{Note 11} lorsque le Comité des politiques (le haut comité exécutif de l'agence que préside le statisticien en chef) a approuvé les modifications importantes apportées à la base de données longitudinales sur les immigrants. L'objectif de cette évaluation était de déterminer s'il existait des problèmes de confidentialité, de sécurité et de protection de la vie privée liés à ces changements et, le cas échéant, de formuler des recommandations en vue de les résoudre ou de les atténuer.

Cette évaluation a conclu que, grâce aux mesures de protection existantes au sein de Statistique Canada ainsi qu'aux mesures additionnelles mises en place pour la Base de données longitudinales sur l'immigration, le risque de divulgation involontaire était extrêmement faible. L'importance des données sur le plan des politiques publiques l'emporte sur les préoccupations relatives à la vie privée. Les mécanismes de gouvernance en place constituent des mesures de protection contre l'utilisation inappropriée des données. Statistique Canada évalue régulièrement la pertinence de la BDIM au moyen d'examens périodiques qu'effectue le Comité des politiques, soupesant chaque fois la pertinence des renseignements par rapport à l'atteinte implicite portée à la vie privée.

Le travail statistique de l'agence comprend des projets de couplage d'enregistrements qui rassemblent des renseignements relatifs aux répondants individuels à des fins de recherche. Il s'agit d'une source reconnue de données statistiques précieuses, mais le couplage doit toujours être d'utilité publique. Afin de faire face à d'éventuelles atteintes à la vie privée dues à ce type de recherche, Statistique Canada respecte non seulement une directive, mais procède en outre à un examen bien défini et exige l'approbation de tous les couplages d'enregistrements.

Pour protéger la vie privée, il est ainsi obligatoire d'arrondir les résultats tabulaires et descriptifs lors de la production de tableaux à partir des données de la BDIM (voir l'annexe D.5).

7 Évaluation des données et indicateurs de qualité

7.1 Sources d'erreurs

Parce que la BDIM est produite à partir de plusieurs couplages d'enregistrements, elle comprend différentes sources d'erreurs, notamment des erreurs de couplage d'enregistrements, de mesure et de couverture. Nous expliquons, dans cette section, les sources d'erreurs et indiquerons l'importance de certaines d'entre elles.

Il convient de noter que, puisqu'il s'agit du recensement des immigrants déclarants admis depuis 1980, aucune pondération n'a été créée au sein de la BDIM. Aucune rectification n'est apportée aux années d'imposition manquantes ni aux erreurs de couplage, aucun échantillonnage n'a lieu et tous les déclarants couplés sont conservés dans l'ensemble de données final. Cependant, le couplage lui-même présente une forme d'erreur d'échantillonnage dans le cas d'échecs de couplage.

7.1.1 Erreurs de couplage d'enregistrements

Les ensembles de données produits à partir des résultats des couplages d'enregistrements peuvent comprendre des erreurs de couplage d'enregistrements. Deux types d'erreurs sont ainsi possibles : des faux positifs (fausses correspondances) et des faux négatifs (fausses non-correspondances). Un couplage est un faux positif lorsque deux enregistrements ne concernant pas la même personne sont comptés comme une correspondance. Un couplage est un faux négatif lorsque deux enregistrements concernant la même personne sont comptés comme une non-correspondance.

Il est possible de manquer une partie de l'historique d'un immigrant, puisque certains possèdent plusieurs numéros d'assurance sociale (NAS) au cours du temps (NAS temporaire attribué à l'admission au résident non permanent, puis NAS permanent attribué après l'admission). Ces deux NAS sont nécessaires pour constituer l'historique fiscal complet depuis l'admission de la personne au Canada. Le FCC (décrit à la section 2.3) permet de recenser ces deux NAS. Il est possible que, dans quelques cas, des liens entre les NAS échouent ou que des liens erronés soient créés.

7.1.1.1 Enregistrements en double

Des doublons peuvent apparaître lors de l’intégration de multiples fichiers analytiques, tels que les fichiers sur la famille T1 (FFT1), les données administratives d’admission (résidence permanente), les permis de résidence temporaire, les enregistrements de citoyenneté, et autres. Bien qu’aucun doublon n’ait été identifié dans les fichiers d’immigration finaux, il y a des doublons dans les fichiers finaux de données fiscales, soit un total de 480 immigrants déclarants sur un total de 6 517 060 immigrants déclarants (0,007%). Les doublons trouvés sont identifiés dans les fichiers de données fiscales de la BDIM à l’aide de la variable DUP_REC. Pour enlever les doublons des analyses, les utilisateurs devraient filtrer les données avec la variable DUP_REC=0 (DUP_REC=1 permet d’identifier les doublons).

La BDIM est un ensemble de données de nature administrative. Les doublons identifiés ont un impact négligeable sur les analyses basées sur la BDIM. Aucun immigrant admis depuis 2011 n’est affecté et les doublons identifiés ne sont pas dans une sous-population spécifique.

7.1.2 Erreurs de mesure

Une erreur de mesure est la différence entre la valeur mesurée d'une variable et sa valeur réelle. On peut attribuer ce type d'erreur à plusieurs facteurs, notamment la saisie de données (p. ex. coquilles) et les erreurs des répondants (p. ex. mauvaise interprétation de la question posée). On a tenu compte de ce type d'erreur lors de la création du Fichier intégré des résidents permanents et non permanents (FRPN) pour éviter les renseignements contradictoires pour toute personne. Lorsqu'un enregistrement existe pour une personne dans le FIR et dans le FRN, par exemple, et que les variables sociodémographiques présentent des valeurs incohérentes, les valeurs à l'admission (celles du FIR) sont conservées. Voir les sections 7.2 et 7.5 qui fournissent certains chiffres.

7.1.3 Erreurs de couverture

Les erreurs de couverture proviennent d'omissions, de l'inclusion d'unités erronées, d'enregistrements en double et d'erreurs de classification d'enregistrements dans la base de données. Ces erreurs de couverture peuvent provenir d'une couverture inadéquate de la population. Elles peuvent se traduire par des estimations biaisées et les répercussions peuvent varier pour différents sous-groupes de la population. Ces erreurs entraînent souvent un sous-dénombrement. Le sous-dénombrement dans le cadre de la BDIM provient en partie de l'exclusion de la base de données des fichiers de données fiscales d'immigrants déclarants. Aucun enregistrement ne figure dans le fichier IMDB_T1FF pour les immigrants qui ne produisent pas de déclaration de revenus pour une année donnée ou qui le font en retard, même s'ils sont couplés aux données fiscales et font partie de la population d'intérêt. Si, pour une raison quelconque, l'enregistrement d'un immigrant n'est pas inclus dans le Fichier des immigrants reçus (FIR), il ne fera pas partie de la BDIM. Un surdénombrement survient lors de l'ajout à la base de données d'enregistrements exclus de la population cible. Un immigrant peut faire l'objet de plusieurs enregistrements dans le FIR du fait de plusieurs admissions non reconnues comme telles, par exemple. Veuillez vous reporter à la section 7.4 et à l'annexe B pour de plus amples détails relatifs à la couverture de la BDIM.

7.2 Exactitude des données

Cette section porte sur l'exactitude des données relatives à l'immigration. Pour de plus amples détails sur l'exactitude du FFT1, veuillez vous reporter au document sur le FFT1 (numéro d'enregistrement 4105).

L'exactitude de la BDIM dépend de la représentativité de la population qui y est incluse. Une étude menée au cours des premières années de la BDIM a conclu que cette dernière « semble être représentative de la population la plus susceptible de produire des déclarations de revenus. Par conséquent, les résultats obtenus à partir de la BDIM ne devraient pas être appliqués à la population immigrante dans son ensemble, mais plutôt à l'univers des immigrants qui produisent des déclarations de revenus » (Carpentier et Pinsonneault, 1994).

Les raisons expliquant les différences entre les déclarants et la population totale des personnes nées à l'étranger sont expliquées dans un article de Badets et Langlois (2000) décrivant les défis d'utilisation de la BDIM :

Les caractéristiques de la population immigrante qui produit des déclarations de revenus diffèrent de celles de l'ensemble de la population née à l'étranger, étant donné que la probabilité ou la nécessité de produire une déclaration de revenus varie selon l'âge, la situation familiale de la personne et d'autres facteurs. On pourrait s'attendre à ce qu'un pourcentage plus élevé d'immigrants de sexe masculin produisent une déclaration de revenus, notamment parce qu'ils ont des taux de participation au marché du travail plus élevés que les femmes. Le niveau de « saisie » des immigrants dans la BDIM est aussi influencé par les changements touchant l'impôt sur le revenu. Par exemple, la mise en place de programmes de crédits d'impôt non remboursables à l'échelle fédérale et provinciale incite les personnes qui n'ont pas de revenus imposables à produire une déclaration de revenus pour être admissibles à certains crédits d'impôt.

Ces commentaires sur la représentativité de la BDIM s'appliquent toujours.

7.2.1 BDIM de 2016 : taux de couplage

Cette section porte sur la BDIM de 2016. Le taux global de couplage entre les données d'immigration d'IRCC et le Dépôt d'enregistrements dérivés de l'ECDS était de 97,6 % (voir section 4). Un lien ne signifie pas nécessairement qu'une déclaration fiscale est disponible puisqu'il est possible de coupler les personnes à charge des déclarants ou des immigrants qui n'ont pas encore produit leur déclaration de revenus. Ce taux de couplage théorique informe principalement sur la façon dont les fichiers d'IRCC pourraient être associés dans un environnement référentiel plus large.

Parmi les immigrants admis entre 1980 et 2016, 83,0 % étaient liés à au moins un FFT1. Ce taux représente la couverture effective du couplage entre les déclarations fiscales et les fichiers d'immigration. Tel que présenté dans les statistiques suivantes, ce taux de couverture peut varier selon le sexe et l'âge.

Tableau 5
Proportion de déclarants couplés, par tranche d'âge à l'admission et par sexe
Sommaire du tableau
Le tableau montre les résultats de Proportion de déclarants couplés, par tranche d'âge à l'admission et par sexe. Âge à l'admission, 0 à 14 ans, 15 à 24 ans, 25 à 34 ans, 35 à 44 ans, 45 à 64 ans, 65 ans et plus et Total, calculées selon pourcentage unités de mesure (figurant comme en-tête de colonne).
	0 à 14 ans	15 à 24 ans	25 à 34 ans	35 à 44 ans	45 à 64 ans	65 ans et plus	Total
	Âge à l'admission
	pourcentage
Hommes	54,1	90,3	92,7	92,5	89,3	77,7	82,9
Femmes	53,3	89,2	92,5	92,8	87,1	75,3	83,0
Total	53,7	89,7	92,6	92,7	88,1	76,3	83,0
Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2016.

À mesure que les immigrants vieillissent, ils commencent à produire des déclarations de revenus et sont inclus dans la BDIM. Le graphique 1 montre que, parmi les immigrants admis à tout âge de 0 à 14 ans, la proportion de déclarants couplés est supérieure pour les immigrants admis avant 2000 que pour ceux admis depuis 2000. Les immigrants récents ont des taux de couplage inférieurs. Voir l'annexe B pour un tableau présentant la proportion de déclarants couplés par groupe d'âge à l'admission, sexe et décennie d'admission.

Proportion de déclarants couplés, par tranche d'âge à l'admission et décennie d'admission

Tableau de données du graphique 1

Tableau de données du graphique 1
Sommaire du tableau
Le tableau montre les résultats de données du graphique 1. Les données sont présentées selon Cohortes (titres de rangée) et Tranche d'âge, 0 à 14 ans, 15 à 24 ans, 25 à 34 ans, 35 à 44 ans, 45 à 64 ans et 65 ans et plus, calculées selon proportion unités de mesure (figurant comme en-tête de colonne).
Cohortes	Tranche d'âge
	0 à 14 ans	15 à 24 ans	25 à 34 ans	35 à 44 ans	45 à 64 ans	65 ans et plus
	proportion
Cohortes de 1980 à 1989	0,72	0,85	0,91	0,91	0,80	0,58
Cohortes de 1990 à 1999	0,80	0,92	0,93	0,93	0,89	0,76
Cohortes de 2000 à 2009	0,53	0,93	0,92	0,93	0,93	0,88
Cohortes de 2010 à 2015	0,09	0,86	0,94	0,93	0,89	0,83
Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2016.

Le tableau 2 illustre la proportion de déclarants ainsi que le nombre de déclarants et de non-déclarants par année d'admission; la mention « non-déclarant » indique qu'aucun enregistrement dans le FFT1 n'est disponible. Dans la BDIM de 2016, le taux de déclaration varie en fonction de l'année d'admission, de 64,6 % pour les personnes admises en 2016 à 90,3 % pour celles admises en 1993. Le taux de déclaration augmente à mesure du nombre d'années de présence des immigrants au Canada; cela peut expliquer pourquoi les taux de couplage sont supérieurs pour les immigrants admis dans les années 1980 et 1990. Voir l'annexe B, tableaux 14 et 15, pour connaître des chiffres de répartition détaillés par année d'admission.

Répartition des déclarants et des non-déclarants par année d'admission

Tableau de données du graphique 2

Tableau de données du graphique 2
Sommaire du tableau
Le tableau montre les résultats de données du graphique 2. Les données sont présentées selon Année d'admission (titres de rangée) et Déclarants, Non-déclarants et Taux, calculées selon nombre d'immigrants et pourcentage unités de mesure (figurant comme en-tête de colonne).
Année d'admission	Déclarants	Non-déclarants	Taux
Année d'admission	nombre d'immigrants		pourcentage
1980	106 500	36 700	74,4
1981	98 500	30 000	76,7
1982	96 300	24 800	79,5
1983	71 200	17 900	79,9
1984	71 300	16 700	81,0
1985	69 400	14 500	82,7
1986	84 000	14 800	85,0
1987	130 700	20 400	86,5
1988	142 300	18 500	88,5
1989	170 000	20 700	89,1
1990	192 300	23 200	89,2
1991	208 700	23 100	90,0
1992	228 900	25 100	90,1
1993	230 800	24 900	90,3
1994	198 600	25 000	88,8
1995	188 500	23 600	88,9
1996	198 200	27 100	88,0
1997	188 800	26 600	87,7
1998	154 900	18 800	89,2
1999	167 800	21 600	88,6
2000	200 800	25 900	88,6
2001	219 500	30 200	87,9
2002	197 500	30 700	86,5
2003	188 800	37 700	83,4
2004	199 100	36 300	84,6
2005	217 700	44 100	83,2
2006	208 400	42 700	83,0
2007	193 700	42 500	82,0
2008	198 900	47 700	80,7
2009	202 200	49 400	80,4
2010	218 000	62 100	77,8
2011	190 800	57 300	76,9
2012	198 500	58 700	77,2
2013	198 000	60 500	76,6
2014	197 000	62 500	75,9
2015	197 200	73 800	72,8
2016	190 770	104 600	64,6
Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2016.

7.2.2 Disponibilité de la date de décès

L'année et le mois d'un décès, ainsi que l'indicateur de décès, sont inclus dans le FRPN. Dans la BDIM de 2016, ces variables ont été couplées à l'aide de la Base canadienne de données sur la mortalité (BCDM). Dans le passé, ces variables étaient fondées sur la Base de mortalité amalgamée (BMA) de Statistique Canada, qui est un ensemble de données archivé qui combine des enregistrements entre la BCDM, les statistiques de l'état civil, et des fichiers fiscaux. La BCDM est une base de données administratives qui recueille des renseignements sur les dates et les causes de décès dans tous les registres provinciaux et territoriaux de l'état civil au Canada. Un certain sous-dénombrement, bien que minime, existe dans la base de données, car il ne comprend pas les décès de Canadiens (1) qui sont morts à l'extérieur du Canada, à l'exception des États-Unis; (2) qui ont servi comme membres des Forces canadiennes, ou (3) dont les corps n'ont pas été identifiés. Il est à noter que la BCDM ne comprend pas les décès qui ont été déclarés dans les dossiers fiscaux.

Les personnes décédées avant 1981 ou qui n'ont jamais produit de déclaration de revenus sont moins susceptibles de faire l'objet d'un couplage du fait des fichiers utilisés pour les couplages.

Le graphique 3 décrit la tendance générale du nombre de décès par an depuis 1980. Un décès de « résident permanent » désigne le décès de tout immigrant admis depuis 1980 et ne possédant pas d'expérience avant son admission. Un décès de « résident permanent ayant un permis avant l'admission » désigne le décès de tout immigrant ayant une expérience avant son admission. La valeur « 9999 » représente les enregistrements d'immigrants décédés pour lesquels l'année de décès n'est pas disponible.

Résidents permanents et non permanents par année de décès

Tableau de données du graphique 3

Tableau de données du graphique 3
Sommaire du tableau
Le tableau montre les résultats de données du graphique 3. Les données sont présentées selon Année (titres de rangée) et Résidents permanents et Résidents permanents ayant un permis avant l'admission, calculées selon nombre de décès unités de mesure (figurant comme en-tête de colonne).
Année	Résidents permanents	Résidents permanents ayant un permis avant l'admission
Année	nombre de décès
1981	1	0
1982	130	0
1983	280	5
1984	350	20
1985	460	30
1986	610	40
1987	820	80
1988	970	80
1989	1 300	90
1990	1 500	130
1991	1 900	160
1992	2 200	210
1993	2 700	280
1994	3 200	340
1995	3 600	400
1996	4 000	440
1997	4 300	510
1998	4 700	560
1999	5 100	580
2000	5 200	590
2001	5 700	680
2002	6 000	770
2003	6 700	890
2004	6 900	910
2005	7 300	980
2006	7 600	1 100
2007	8 300	1 200
2008	8 600	1 300
2009	9 000	1 400
2010	9 200	1 600
2011	9 900	1 700
2012	10 000	1 800
2013	10 900	1 900
2014	11 700	2 100
2015	12 346	2 300
2016	12 900	2 500
9999	130	170
Note : La valeur 9999 a été utilisée lorsque la date de décès n'était pas disponible. Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2016.

7.2.3 Déclarants avant l'admission par rapport aux enregistrements du Fichier des résidents non permanents (FRN)

Les résultats inclus dans cette section sont tirés d'une étude fondée sur la BDIM de 2014. Les déclarants avant l'admission sont des immigrants qui ont produit une déclaration de revenus avant leur année d'admission. Il est parfois déduit que tous les déclarants avant l'admission sont des immigrants qui étaient des résidents non permanents avant leur admission. Cette section explique pourquoi ce n'est pas le cas. Au total, 1,26 million de personnes ont produit une déclaration de revenus avant leur admission officielle depuis 1980; sur ce total, 212 500 ne sont pas couplées à un enregistrement de résident non permanent, contrairement à ce à quoi l'on pourrait s'attendre. Après une enquête approfondie, on a découvert que la plupart des déclarants avant l'admission qui étaient des résidents permanents non couplés à un enregistrement de résident non permanent étaient probablement des immigrants ayant produit une déclaration de revenus lorsque cela n'était pas requis : 96 % de ces déclarants avant l'admission ont uniquement produit une déclaration de revenus pour l'année précédant leur année d'admission et 75 % n'ont déclaré aucun revenu (96 % n'avaient aucun salaire). Comme le montre le graphique 4, la plupart de ces déclarants avant l'admission ont été admis au cours des premiers mois de l'année, avant la date d'échéance de la production d'une déclaration de revenus pour l'année précédente. Il semble que certains immigrants admis avant le mois de mai ont produit une déclaration de revenus pour l'année précédant leur année d'admission; ce qu'ils n'étaient pas tenus de faire.

Selon ces résultats, qu'il soit justifié de supprimer les enregistrements présentant les variables de déclarant avant l'admission Prefiler_ind=1 et TR_IND=0 des études sur les immigrants ayant une expérience avant leur admission dépend de l'analyse, puisque TR_IND=0 signifie qu'aucun enregistrement ne figure dans le fichier de permis de résidents non permanents.

Répartition des déclarants avant l'admission sans permis de résidence non permanente, par mois d'admission

Tableau de données du graphique 4

Tableau de données du graphique 4
Sommaire du tableau
Le tableau montre les résultats de données du graphique 4. Les données sont présentées selon Mois d'admission (titres de rangée) et Nombre d'immigrants(figurant comme en-tête de colonne).
Mois d'admission	Nombre d'immigrants
Janvier	32 300
Février	36 100
Mars	35 500
Avril	24 100
Mai	20 500
Juin	18 200
Juillet	16 100
Août	11 200
Septembre	9 800
Octobre	5 500
Novembre	2 000
Décembre	1 200
Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2014.

Tous les immigrants ayant une expérience avant leur admission ne sont pas considérés comme étant des déclarants avant l'admission : 478 100 immigrants disposent d'enregistrements de résidents non permanents avec la variable Prefiler_ind=0. En fonction du sujet étudié, utiliser la variable TR_IND=1 ou le nombre de permis de résidence temporaire (variable NUMBER_ALL_PERMITS) est plus approprié pour étudier les immigrants ayant une expérience avant leur admission. La variable Prefiler_ind=0 indique qu'aucune déclaration de revenus n'a été produite avant l'admission, mais elle ne signifie pas que la personne n'a pas d'expérience au Canada avant son admission.

7.2.4 Indicateur de conjoint

La BDIM contient des variables permettant aux utilisateurs de données d'obtenir des renseignements sur l'état matrimonial et les conjoints. La section suivante présente les résultats d'une étude menée sur la BDIM de 2012. Aucune modification majeure n'a été apportée depuis aux codes d'état matrimonial ni à l'indicateur relatif à la famille.

L'identificateur de conjoint (SP__IDI) est dérivé des fichiers de données fiscales. Ce renseignement peut uniquement être dérivé lorsque le répondant déclare son conjoint ou sa conjointe lors de sa déclaration de revenus; cela entraîne une sous-estimation des couples par rapport à l'état matrimonial déclaré dans les fichiers de données fiscales. Il est également possible à partir du FFT1 d'obtenir l'état matrimonial au moment de la déclaration.

Avant 1991, la catégorie « célibataire » n'était pas proposée comme état matrimonial (MSTCO). La catégorie « conjoint de fait » est disponible depuis 1992 pour tous les ensembles de données (1982 à 2012). Depuis 1992, la proportion des enregistrements de la BDIM indiquant un état matrimonial « célibataire » varie entre 20 % et 30 %. La proportion de personnes « séparées » a diminué, passant de 30 % avant 1992 à 4 % par la suite. Des modifications de tendance n'ont pas influé sur les autres catégories d'état matrimonial.

Une analyse portant sur la répartition de l'état matrimonial (MSTCO des fichiers de données fiscales) et l'identificateur de conjoint (SP__IDI) a révélé des différences entre ces deux variables. Ces différences sont dues à l'absence de valeurs d'état matrimonial dans certains enregistrements. Dans une situation parfaite, les enregistrements de toutes les personnes mariées présenteraient des renseignements sur le conjoint et ceux de toutes les personnes célibataires n'en indiqueraient pas. L'analyse effectuée a indiqué que la qualité des données s'était améliorée après 1992, lorsque les états matrimoniaux distincts « conjoint de fait » et « célibataire » ont été introduits.

Lacunes d'indication de conjoint

À la suite d'un examen de l'historique longitudinal des immigrants sur la BDIM de 2012, on a relevé des cas où le conjoint ou conjoint de fait manquait (ou différait) pour une année donnée et où le même conjoint était déclaré deux ou trois ans plus tard. Le graphique 5 fournit un résumé de ces lacunes.

Proportion des cas présentant un identificateur de conjoint (SP__IDI) incohérent, par année d'admission

Tableau de données du graphique 5

Tableau de données du graphique 5
Sommaire du tableau
Le tableau montre les résultats de données du graphique 5. Les données sont présentées selon Année d'imposition (titres de rangée) et Pourcentage (figurant comme en-tête de colonne).
Année d'imposition	Pourcentage
1980	16,8
1981	16,6
1982	17,1
1983	17,7
1984	17,4
1985	17,7
1986	17,7
1987	16,9
1988	14,4
1989	13,9
1990	13,4
1991	14,4
1992	13,5
1993	12,7
1994	9,8
1995	9,4
1996	8,7
1997	8,1
1998	7,8
1999	7,1
2000	6,3
2001	5,6
2002	5,0
2003	4,6
2004	4,0
2005	3,1
2006	2,9
2007	2,4
2008	1,8
2009	1,1
2010	0,7
2011	0,5
Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2012.

La plupart des immigrants du fichier ont un conjoint ou non entre 1980 et 2012 selon les fichiers IMDB_T1FF. Il faut souligner qu'aucun état matrimonial (et aucun renseignement sur le conjoint) n'est disponible pour 1,2 million d'immigrants sur environ 6 millions d'immigrants.

7.3 Imputation des variables relatives à la scolarité

Un problème de qualité des données a en outre été relevé quant aux variables relatives au niveau de scolarité et aux années d'études. Une proportion non négligeable de personnes n'ayant pas déclaré leur niveau de scolarité ou d'années d'études ont reçu le code « 0 » soit « aucun » plutôt que « manquant » pour les variables EDUCATION_QUALIFICATIONS et YEARS_OF_SCHOOLING. Ce problème est devenu courant de 2011 à 2014. En 2011, 35 % des immigrants ont indiqué ne pas avoir suivi d'études, par rapport à environ 10 % dans les années 1990.

Ce problème a été résolu en imputant des variables de scolarité à partir des moyennes des valeurs des variables de scolarité de 2008 à 2010, pour refléter les variables de scolarité de l'année la plus récente. Pour cette imputation, on a utilisé des variables telles que l'âge à l'admission, le groupement de catégories d'immigration 2, la profession envisagée, le sexe et le pays de dernière résidence. La méthodologie d'imputation du plus proche voisin a été employée. La variable d'imputation de la scolarité Education_imputation_ind (0 : non; 1 : oui), disponible dans le FRPN, a été créée pour déterminer les enregistrements au sein desquels les variables de scolarité ont été imputées.

Pour les immigrants admis en 2015 et 2016, le nombre de cas où une scolarité non-déclarée a reçu le code « 0 » ou « aucun » plutôt que « manquant » a été réduit. Cependant, un nombre non négligeable d'enregistrements avait un niveau de scolarité manquant avec des années d'études valides. Pour ces enregistrements, les années d'études ont été utilisées pour imputer une valeur pour le niveau de scolarité.

Dans la BDIM de 2016, le problème de la qualité des données a persisté en raison de l'augmentation de valeurs manquantes pour le niveau de qualification et les années de scolarité. Par conséquent, l'information sur l'éducation a été supprimée pour les admissions de 2017.

7.4 Couverture

7.4.1 Couverture du Fichier intégré des résidents permanents et non permanents (FRPN)

Le Fichier intégré des résidents permanents et non permanents (FRPN) de 2016 contient plus de 7,7 millions d'enregistrements (tableau 6); parmi ceux-ci, plus de 6,4 millions (83,0 %) sont couplés à au moins un fichier de données fiscales. Les données sur l'immigration des non-déclarants sont incluses dans un fichier intitulé PNRF_NONFILERS_2016, alors que les données sur l'immigration des déclarants est intitulé PNRF_2016. Le tableau suivant présente la répartition des enregistrements en fonction de leur présence dans les différents fichiers d'immigration et de données fiscales. Environ 1,7 million d'enregistrements portent sur des immigrants qui étaient des résidents temporaires avant de devenir résidents permanents; plus de 1,6 million de ces enregistrements sont couplés à au moins un fichier de données fiscales. Voir l'annexe B pour des chiffres de répartition détaillés par année d'admission.

Tableau 6
Couverture des résidents permanents
Sommaire du tableau
Le tableau montre les résultats de Couverture des résidents permanents. Résidents permanents, Résidents permanents ayant un permis de résidence non permanente et Nombre de déclarants, calculées selon nombre et pourcentage unités de mesure (figurant comme en-tête de colonne).
	nombre
	Résidents permanents	Résidents permanents ayant un permis de résidence non permanente	Nombre de déclarants
Total des déclarants	4 812 700	1 601 900	6 414 600
Total des non déclarants	1 221 900	92 800	1 314 700
Total	6 034 600	1 694 700	7 729 300
	pourcentage
Pourcentage de déclarants	79,8	94,5	83,0
Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2016.

Les données relatives aux immigrants possédant des permis de résidence non permanente sont disponibles. La proportion d'immigrants ayant une expérience avant l'admission varie en fonction de l'année d'admission (graphique 6); elle va de 4 % en 1980 à 35 % en 1992. Comme il est mentionné dans la section 2.1.2, les permis de résidence non permanente délivrés avant 1980 ne sont pas disponibles dans la BDIM. Par conséquent, la proportion d'immigrants ayant une expérience avant l'admission au début des années 1980 est sous-représentée. La proportion des immigrants déclarants possédant une expérience avant leur admission (ligne pleine) est supérieure à la proportion globale des immigrants possédant une expérience avant leur admission (ligne pointillée), car le taux de couplage de ces immigrants est supérieur à celui des immigrants sans expérience avant leur admission.

Répartition des immigrants avec permis de résidence non permanente, par année d'admission

Tableau de données du graphique 6

Tableau de données du graphique 6
Sommaire du tableau
Le tableau montre les résultats de données du graphique 6. Les données sont présentées selon Année d'admission (titres de rangée) et Tous les immigrants, Déclarants et Non-déclarants, calculées selon pourcentage unités de mesure (figurant comme en-tête de colonne).
Année d'admission	Tous les immigrants	Déclarants	Non-déclarants
Année d'admission	pourcentage
1980	3,8	4,3	2,5
1981	11,3	12,8	6,5
1982	14,2	15,8	7,9
1983	17,3	19,4	8,8
1984	19,8	22,2	9,7
1985	19,5	22,1	8,5
1986	24,8	27,0	11,6
1987	23,4	25,4	10,4
1988	11,5	12,0	7,4
1989	13,6	14,4	7,4
1990	16,6	17,7	7,5
1991	32,0	34,2	12,0
1992	34,7	37,0	13,8
1993	26,8	28,4	11,5
1994	18,1	19,5	7,3
1995	19,9	21,5	7,1
1996	19,6	21,4	6,4
1997	17,4	19,1	5,6
1998	19,3	20,8	6,9
1999	19,0	20,6	6,4
2000	18,2	19,8	5,8
2001	16,3	17,8	5,0
2002	15,1	16,8	4,4
2003	15,7	17,7	4,0
2004	19,1	21,7	4,9
2005	20,0	23,0	5,4
2006	22,7	26,1	5,9
2007	23,3	27,1	6,0
2008	23,2	27,5	5,2
2009	24,2	28,7	5,6
2010	23,0	27,9	5,7
2011	23,6	28,6	6,8
2012	25,4	30,9	6,9
2013	26,9	32,8	7,6
2014	34,1	42,1	8,9
2015	33,2	42,4	8,6
2016	30,0	42,2	7,8
Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2016.

7.4.2 Taille du Fichier sur la famille T1 et couverture par année

Les fichiers de données fiscales sont disponibles à partir de 1982 pour les résidents permanents couplés. Certains résidents permanents étaient des résidents non permanents avant leur admission. Le tableau 7 fournit des détails sur la répartition des résidents permanents couplés, avec ou sans permis de résidence non permanente avant leur admission, par année d'imposition. Au moins un fichier de données fiscales est disponible pour 79,8 % de résidents permanents sans permis de résidence non permanente avant leur admission et pour 94,5 % de résidents permanents qui étaient résidents non permanents avant leur admission. Le fait que les résidents permanents possédant des permis temporaires avant leur admission présentent un taux plus élevé de déclarations de revenus que les résidents permanents sans permis avant leur admission peut s'expliquer par une exigence relative au processus de demande de résidence permanente pour les résidents non permanents. Les résidents non permanents qui demandent la résidence permanente doivent en effet respecter l'obligation de déclaration de revenus au Canada. Le nombre de déclarants dans le fichier IMDB_T1FF augmente à mesure des années, puisque la taille de la population dans le champ d'enquête augmente.

Tableau 7
Résidents permanents et non permanents par année d'imposition
Sommaire du tableau
Le tableau montre les résultats de Résidents permanents et non permanents par année d'imposition. Résidents permanents, Résidents permanents ayant un permis de résidence non permanente et Nombre de déclarants, calculées selon nombre et pourcentage unités de mesure (figurant comme en-tête de colonne).
	nombre
	Résidents permanents	Résidents permanents ayant un permis de résidence non permanente	Nombre de déclarants
1982	175 900	53 900	229 800
1983	209 700	63 600	273 400
1984	246 000	77 700	323 700
1985	277 900	92 700	370 500
1986	332 200	122 100	454 300
1987	388 600	155 300	543 900
1988	477 800	196 900	674 700
1989	588 600	260 500	849 100
1990	708 500	308 200	1 016 700
1991	805 800	357 100	1 162 900
1992	911 100	401 200	1 312 300
1993	1 051 700	440 300	1 492 000
1994	1 172 000	465 900	1 637 900
1995	1 283 100	491 300	1 774 400
1996	1 389 800	512 300	1 902 100
1997	1 503 200	532 900	2 036 100
1998	1 602 200	553 100	2 155 300
1999	1 725 500	588 900	2 314 400
2000	1 868 300	629 300	2 497 600
2001	2 024 900	678 300	2 703 300
2002	2 155 000	715 900	2 870 900
2003	2 277 300	753 000	3 030 200
2004	2 408 500	794 800	3 203 200
2005	2 524 900	828 400	3 353 300
2006	2 674 500	885 200	3 559 700
2007	2 798 100	953 200	3 751 300
2008	2 923 400	1 029 500	3 953 000
2009	3 039 100	1 093 900	4 133 000
2010	3 165 200	1 147 500	4 312 600
2011	3 295 600	1 207 400	4 503 000
2012	3 413 700	1 265 300	4 678 900
2013	3 546 200	1 322 000	4 868 300
2014	3 664 900	1 367 000	5 031 900
2015	3 791 100	1 387 500	5 178 600
2016	3 906 100	1 397 100	5 303 200
Total des déclarants	4 812 700	1 601 900	6 414 600
Total des non-déclarants	1 221 900	92 800	1 314 700
	pourcentage
Pourcentage de déclarants	79,8	94,5	83,0
Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2016.

Le graphique 7 montre que la proportion des résidents permanents qui étaient résidents non permanents avant leur admission, par année, varie de 23.3 %, plus bas niveau correspondant à l'année d'imposition de 1983, à 30,0 %, niveau le plus élevé correspondant à l'année d'imposition de 1991. Depuis les années 2000s, cette proportion est demeurée stable, à environ 26 %.

Pourcentage de résidents permanents qui étaient résidents non permanents avant leur admission, par année d'imposition

Tableau de données du graphique 7

Tableau de données du graphique 7
Sommaire du tableau
Le tableau montre les résultats de données du graphique 7. Les données sont présentées selon Année d'imposition (titres de rangée) et Pourcentage (figurant comme en-tête de colonne).
Année d'imposition	Pourcentage
1982	23,5
1983	23,3
1984	24,0
1985	25,0
1986	26,9
1987	28,6
1988	29,2
1989	30,7
1990	30,3
1991	30,7
1992	30,6
1993	29,5
1994	28,4
1995	27,7
1996	26,9
1997	26,2
1998	25,7
1999	25,4
2000	25,2
2001	25,1
2002	24,9
2003	24,8
2004	24,8
2005	24,7
2006	24,9
2007	25,4
2008	26,0
2009	26,5
2010	26,6
2011	26,8
2012	27,0
2013	27,2
2014	27,2
2015	26,8
2016	26,3
Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2016.

Un immigrant qui produit une déclaration de revenus pour une année donnée n'en produira pas nécessairement l'année suivante. Si une personne A, par exemple, a été admise en 1983, elle peut figurer dans les fichiers de données fiscales de 1984 à 1999, mais pas dans le fichier de 2000, et y figurer ensuite à nouveau de 2001 à 2013. Ainsi, des fichiers de données fiscales étaient disponibles tous les ans pour 34 % des déclarants de la cohorte de 1980. Une émigration externe, un décès ou un retard de déclaration peut expliquer, en outre, que des immigrants déclarants aient pu ne plus produire de déclaration de revenus ou ne pas en produire certaines années.

La plupart des immigrants déclarent leurs revenus pour la première fois l'année de leur admission ou l'année précédente ou suivante. Ainsi, sur les 251 100 immigrants admis en 2006, 102 030 (40,6 %) ont produit une déclaration de revenus pour la première fois en 2006, alors que 16 160 (6,4 %) l'ont fait en 2007 et 3 155 (1,3 %) en 2015.

7.5 Évaluation de la qualité du Fichier intégré des résidents permanents et non permanents (FRPN)

Le contenu du FRPN de 2016 a été évalué. Alors que la collecte des données fiscales et relatives à l'admission est obligatoire pour les personnes dans le champ d'enquête, ces dernières peuvent ne pas remplir tous les champs. Ces champs ont pu être laissés vides parce que le répondant ne connaissait pas la réponse ou pour d'autres raisons, que les utilisateurs des données ne peuvent connaître (p. ex. refus) (McLeish, 2011). L'absence de réponse à certaines questions peut présenter des problèmes lorsque la BDIM est utilisée à des fins statistiques, notamment dans les cas suivants :

Si l'utilisateur de la base de données souhaite produire un échantillon fondé sur les caractéristiques pour lesquelles des enregistrements manquent, une erreur de couverture peut survenir (c.-à-d. les personnes incluses dans la base d'échantillon peuvent ne pas être représentatives de la population cible).
S'il s'agit d'une absence de données informatives (p. ex. l'absence du renseignement n'est pas un cas aléatoire; l'absence de réponse indique ce que la réponse aurait été), toute analyse utilisant ces variables serait biaisée.

On a évalué la présence de variables manquantes et de valeurs non valides. Les chiffres présentés dans cette section sont arrondis. Les valeurs non valides sont soit incohérentes soit elles ne figurent pas dans les tableaux de métadonnées à la disposition des utilisateurs (voir la composante sur l'immigration du dictionnaire de données en annexe). La plupart des problèmes de qualité figurant dans le tableau 8 concernent des données recueillies dans les années 1980 et 1990. Il convient de souligner que des valeurs semblant valides peuvent également être erronées.

La variable de numéro d'identification du cas (CASE_ID) présente des taux de réponse aux éléments se situant généralement dans la frange supérieure des 90 % (généralement plus de 99 %). Cependant, pour certaines années d'admission, le taux de réponse diminue significativement (jusqu'à 80 % en 1991 et 1992). Par conséquent, toute analyse fondée sur cette variable pour toutes les années d'admission sous-représentera ces années, pour lesquelles le manque de réponse à l'élément est plus élevé (p. ex. 1986, 1987, 1990, 1991, 1992, 1993). Aucune détection des valeurs non valides n'a eu lieu pour la variable de numéro d'identification du cas (CASE_ID).

La variable d'âge à l'admission Landing_age est définie comme non valide lorsqu'elle dépasse 99, même s'il est possible dans certains cas que ces valeurs soient exactes. Il convient de souligner que, selon les valeurs de cette variable, le nombre d'immigrants admis après l'âge de 99 ans était bien plus élevé entre 1986 et 1994 que pour les autres années d'admission. Il pourrait s'agir d'un problème de saisie de données.

Dans le FRPN de 2016, dix enregistrements présentaient une année de naissance antérieure à 1880 et cinq, une année d'admission antérieure à l'année de naissance. La valeur de sexe manque pour 700 immigrants, principalement pour des personnes admises dans les années 1980.

Les variables relatives au pays présentent également des problèmes de qualité. Le pays de naissance manque dans certains enregistrements pour pratiquement toutes les années d'admission. Des valeurs manquent, par exemple, pour plus de 100 enregistrements dans chacune des années de 1985 à 1993. Le pays de citoyenneté manque pour moins de 10 enregistrements par année d'admission pour la plupart des années (à l'exception de 2004, 2005 et 2006, pour lesquelles plus de 40 enregistrements ne contiennent pas d'année d'admission). Le pays de résidence manque pour de nombreux enregistrements d'admission pour 2013 (cette valeur manque pour 980 enregistrements, soit 0,5 % des admissions de cette année-là), pour 2014 (cette valeur manque pour 4 000 enregistrements, soit 2 % des admissions de cette année-là) et pour 2015 (manquant pour 5 000 enregistrements, soit 3 % des admissions de cette année-là).

Les variables de scolarité après imputation (voir la section 6.3) présentent plus de 150 valeurs manquantes par année d'admission de 1980 à 1984; cela équivaut à un taux de valeurs manquantes par année d'admission de moins de 0,5 %.

Le pourcentage de réponses valides pour les variables de profession est plus de 99 % pour toutes les années d'admission.

La plupart des valeurs manquantes pour les variables de statut dans la famille Family_Status, de langue maternelle Mother_Tongue, de langue officielle Official_Language, d'immigrants sélectionnés par le Québec CSQ_IND et de province de destination Destination_Province concernent les enregistrements des années d'admission antérieures à 1999. La variable de langue maternelle Mother_Tongue manque pour 460 enregistrements relatifs aux admissions de 2011.

Les variables d'année et de mois de décès manquent pour certaines personnes reconnues comme décédées (Death_Indicator=1). La valeur « 9999 » a été attribuée à la variable d'année de décès Death_Year et la valeur « 99 » à celle du mois de décès Death_Month dans les cas où l'année et le mois de décès étaient inconnus.

Les variables Destination_CD, Destination_CMA, et Destination_CSD ont moins de valeurs manquantes dans la BDIM 2016 que lors des années précédentes suite à la mise à jour avec la Classification Géographique Type (CGT) de 2016.

Tableau 8
Évaluation de la qualité du Fichier intégré des résidents permanents et non permanents
Sommaire du tableau
Le tableau montre les résultats de Évaluation de la qualité du Fichier intégré des résidents permanents et non permanents. Les données sont présentées selon Variables du FRPN (titres de rangée) et Réponses valides, Champs vides et Réponses non valides, calculées selon nombre et pourcentage unités de mesure (figurant comme en-tête de colonne).
Variables du FRPN	Réponses valides		Champs vides		Réponses non valides
Variables du FRPN	nombre	pourcentage	nombre	pourcentage	nombre	pourcentage
Case_ID	6 241 300	97,30	173 300	2,70	0	0,00
Landing_age	6 414 100	99,99	0	0,00	500	0,01
Birth_Year	6 414 600	100,00	0	0,00	0	0,00
Gender	6 413 900	99,99	700	0,01	0	0,00
Country_Birth	6 412 000	99,96	2 600	0,04	0	0,00
Country_Citizenship	6 414 000	99,99	600	0,01	0	0,00
Country_Residence	6 403 200	99,82	11 400	0,18	0	0,00
Education_Qualification	6 402 600	99,81	12 000	0,19	0	0,00
Level_of_Education	6 406 000	99,87	8 600	0,13	0	0,00
Years_of_Schooling	6 405 300	99,86	9 300	0,14	0	0,00
Landing_age_6_groups	6 414 100	99,99	500	0,01	0	0,00
Landing_age_9_groups	6 414 100	99,99	500	0,01	0	0,00
Occupation_CD	6 411 500	99,95	3 100	0,05	0	0,00
NOC5-NOC2	6 409 600	99,92	5 000	0,08	0	0,00
Family_Status	6 412 300	99,96	2 300	0,04	0	0,00
Family_Status_rollup	6 412 300	99,96	2 300	0,04	0	0,00
Marital_status	6 412 900	99,97	1 700	0,03	0	0,00
Marital_status_rollup	6 412 900	99,97	1 700	0,03	0	0,00
Mother_Tongue	6 412 200	99,96	2 400	0,04	0	0,00
Official_Language	6 404 300	99,84	10 300	0,16	0	0,00
Skill_level_CD11	5 293 500	82,52	1 121 100	17,20	0	0,00
Special_Program	1 186 700	18,50	5 227 900	81,50	0	0,00
CSQ_ind	6 414 600	100,00	25	0,00	0	0,00
Destination_CD	6 414 400	100,00	200	0,00	0	0,00
Destination_CMA	6 414 400	100,00	200	0,00	0	0,00
Destination_CSD	6 414 400	100,00	200	0,00	0	0,00
Destination_Province	641 440	100,00	200	0,00	0	0,00
Permis et RNP - variables spécifiques	1 695 100	100,00	0	0,00	0	0,00
Death_Year and Death_Month	214 200	95,26	300	0,01	0	0,00
Notes : FRPN : Fichier intégré des résidents permanents et non permanents. Le nombre de valeurs manquantes pour la variable Skill_level_CD11 comprend des valeurs abandonnées/anciennes et des valeurs manquantes du CNP. Seules les variables présentant des valeurs manquantes ou non valides ont été incluses dans ce tableau. Tous les chiffres sont arrondis. Source : Statistique Canada, Base de données longitudinales sur l'immigration 2016.

7.6 Évaluation de la qualité de la variable de la province de résidence (PRCO_)

Une validation des variables géographiques incluses dans les fichiers fiscaux de la BDIM a été effectuée. Cette section explique comment la variable Province de résidence (PRCO_) a été dérivée et sa qualité.

La province de résidence (PRCO_) est fondée sur les renseignements fournis par les déclarants, lorsque disponible. Les renseignements manquants pour la province de résidence sont remplacés par les renseignements recueillis sur le code postal de l'adresse postale de l’individu (PSCO_I), si disponible, sinon celui de la famille est utilisé (PSCO_F).

Tableau 9
Concordance entre le PRCO et le PSCO__
Sommaire du tableau
Le tableau montre les résultats de Concordance entre le PRCO et le PSCO__. Les données sont présentées selon PRCO (titres de rangée) et Province et Territoires et Premier caractère du code postal (PSCO)(figurant comme en-tête de colonne).
PRCO	Province et Territoires	Premier caractère du code postal (PSCO)
0	Terre-Neuve-et-Labrador	A
2	ÎIle-du-Prince-Édouard	B
1	Nouvelle-Écosse	C
3	Nouveau-Brunswick	E
4	Québec	G, H, J
5	Ontario	K, L, M, N ,P
6	Manitoba	R
7	Saskatchewan	S
8	Alberta	T
9	Colombie-Britannique	V
10	Territoires du Nord-Ouest	X
11	Yukon	Y
12	Non-résidents	manquant
14	Nunavut	X

Bien que la province de résidence (PRCO_) soit plus fiable que la province d'imposition (TXPCO_), certaines anomalies ont été observées principalement sur le code des non-résidents dans les déclarations des années d'imposition 1989, 1993, 1998 et 2004 à 2006. Celles-ci peuvent avoir une incidence sur certaines provinces.

Pour les années d'imposition 2004 à 2006, nous observons une surestimation pour la province de résidence Terre-Neuve-et-Labrador (PRCO_= 0) causée par l'inclusion de certains non-résidents. Pour réduire l'effet des incohérences observées, il est conseillé aux utilisateurs de remplacer la valeur PRCO_ 0 par la valeur 12 (non-résidents) lorsque la variable PSCO_I est égale à "U" (États-Unis) ou "F" (étranger). Bien que les concepts qui sous-tendent PSCO_ et PRCO_ soient semblables, le PSCO_ est fondé sur le lieu de résidence au moment de transmettre la déclaration et non au 31 décembre. Par exemple, le remplacement des valeurs entraînera une réduction de 455 enregistrements à Terre-Neuve-et-Labrador (PRCO_= 0) dans l’année d’imposition 2006 pour les immigrants admis 2000.

De plus, la BDIM_T1FF de 1993 comprend des anomalies pour la province du Manitoba qui compte un nombre inhabituel de résidents (48 130 en 1993, comparativement à 33 650 l'année d'imposition précédente et à 37 365 l'année d'imposition suivante). Des changements semblables sont observés dans les Territoires du Nord-Ouest. De plus, 740 personnes sont codées comme résidant au Nunavut alors que le Nunavut a été créé en 1998. 725 personnes sont codées comme résidant dans plusieurs juridictions. Les utilisateurs peuvent utiliser l'information de la variable PSCO_F pour diminuer l'effet des anomalies sur leurs analyses qui incluent la province de résidence. Toutefois, comme nous l'avons indiqué plus haut, le moment est différent entre PSCO (basé sur le lieu de résidence lors de la transmission de la déclaration) et PRCO_ (lieu de résidence au 31 décembre).

Les enregistrements des non-résidents (PRCO_=12) semblent surestimés dans le fichier IMDB_T1FF de 1989. Il comprend 79 210 non-résidents du Canada, dont bon nombre ont un statut de résident non permanent. Les utilisateurs peuvent décider d'utiliser le code postal de l'adresse postale (PSCO_ au niveau individuel ou familial) pour calculer la valeur du PRCO_ ou retirer les non-résidents de leur analyse.

Dans la BDIM_T1FF de 1998, un nombre plus élevé que prévu d'enregistrements est attribué à Terre-Neuve-et-Labrador (PRCO_). Dans ces cas, le lieu de résidence de la famille au moment du dépôt de la demande est également Terre-Neuve selon la variable PSCO_F.

8 Comparabilité

8.1 Variation historique de la couverture

Au cours des années, la couverture et le contenu de la BDIM ont évolué. Les fichiers IMDB_T1FF initiaux comprenaient uniquement des données sur les immigrants admis au Canada à partir de 1980. Depuis la parution de la BDIM de 2013, les résidents non permanents déclarants ont été ajoutés aux fichiers IMDB_T1FF pour les années d'imposition de 1982 et ultérieures. Du fait de ce changement, on peut désormais disposer de renseignements sur les permis de résidence temporaire des immigrants ayant une expérience au Canada avant leur admission.

En 2012, la BDIM a fait l'objet d'une refonte. La couverture de la BDIM a été modifiée pour inclure à la base de données des immigrants ayant obtenu leur statut d'immigrant reçu à partir de 1980 et ayant produit au moins une déclaration de revenus depuis 1982, qu'ils en aient produit une ou non après leur admission. La BDIM incluait initialement uniquement des personnes ayant obtenu le statut d'immigrant reçu à partir de 1980 et ayant produit au moins une déclaration de revenus après avoir été reçues comme immigrants. Avant ce cycle, la BDIM incluait jusqu'aux seize premières années des fichiers de données fiscales relatifs à un résident permanent donné (Dryburgh, 2004). Cette limite du nombre de fichiers de données fiscales pour une personne donnée ne s'applique plus.

Les données fiscales incluses dans la BDIM provenaient à l'origine principalement des formulaires T1 et seulement quelques variables fiscales importantes au niveau personnel étaient conservées. Dans la BDIM de 2006 et les BDIM suivantes, on a utilisé les fichiers FFT1 relatifs à 1982 et aux années ultérieures; cela a produit un taux de couplage initial de 80 %. À partir de là, la BDIM a exclu les fichiers de données fiscales de 1980 et 1981, puisque les renseignements pour ces années ne figurent pas dans le FFT1.

On utilisait initialement le Système de soutien des opérations des bureaux locaux (SSOBL) pour rassembler les données d'immigration incluses dans la BDIM. Pour l'année d'immigration de 2013 et les suivantes, le système mondial de gestion des cas (SMGC) sera utilisé. IRCC a, par conséquent, cessé de fournir certaines variables. Ces anciennes variables seront disponibles dans le fichier PNRF_extra; elles figurent dans la composante sur l'immigration du dictionnaire des données de la BDIM.

8.2 Changements méthodologiques

La méthodologie employée pour effectuer le couplage d'enregistrements a fait l'objet de changements au cours des années.

Le taux de couplage initial de la BDIM était de 55 % pour la BDIM de 1995 (Langlois et Dougherty, 1997). Les méthodes et outils employés pour le couplage d'enregistrements ont depuis évolué; ce qui explique l'amélioration des taux de couplage au cours des années.

À la fin des années 2000, le taux de couplage était d'environ 81 %. Pour la BDIM de 2012, les renseignements sur les personnes à charge ont servi pour procéder au couplage d'enregistrements; cela a permis de coupler une plus grande proportion d'enfants immigrants. Ces renseignements figuraient dans le fichier de la PFCE. Il convient de noter que l'ajout des enfants n'améliore pas le taux de déclarants. Grâce aux changements méthodologiques, le taux de couplage pour la BDIM de 2014 a atteint 89 %.

Pour la BDIM de 2015, en incluant dans le processus de couplage le Registre d'assurance sociale (RAS) – une base de données spécifiquement pour les données de NAS – le taux de couplage a augmenté à 97 %. Le Registre d'assurance sociale fournit des données de très haute qualité, et environ 730 000 numéros d'assurance sociale se trouvent exclusivement sur ce registre (Diaz-Papkovich 2017).

Pour la BDIM 2016, un nouveau processus de couplage d'enregistrements a été utilisé afin de faciliter le couplage avec d'autres sources de données. Les données d'immigration ont été couplées aux données fiscales par l'intermédiaire de l'ECDS (voir la section 4). À partir de maintenant, le couplage se fera au Dépôt d'enregistrements dérivés de Statistique Canada.

8.3 Changements du contenu de la base de données historiques

Veuillez-vous reporter aux dictionnaires de la BDIM (composantes sur l'immigration et les impôts) pour une description complète du contenu des fichiers. Certaines importantes modifications récentes du contenu de la BDIM sont énumérées ci-après.

En 2012, la BDIM de 2009 a fait l'objet d'un remaniement; un indicateur a en effet été ajouté pour détecter les valeurs aberrantes dans les fichiers FFT1 créés. La variable d'identificateur de conjoint (SP_IDI) a été introduite dans la BDIM de 2010, permettant de recenser les immigrants ayant un conjoint immigrant. Les années et mois de décès ont été ajoutés à la BDIM de 2013; cela a permis de recenser les immigrants admis au Canada à partir de 1980 et décédés depuis. À la suite de l'ajout à la BDIM des données relatives aux résidents non permanents, certains détails sur les permis de résidence temporaire (type, dates d'entrée en vigueur, etc.) sont désormais disponibles depuis la BDIM de 2013.

Pour la BDIM de 2016, des drapeaux identifiant les immigrants sélectionnés selon l'entrée express, les vagues de réfugiés syriens rétablis, ainsi que l'année et le mois de citoyenneté ont été ajoutés.

8.4 Comparabilité avec d'autres sources des données sur l'immigration

La BDIM est l'un des nombreux programmes statistiques pouvant servir à produire des estimations relatives à la population immigrante. Dans certains cas, ces estimations différeront du fait de plusieurs facteurs, comme la couverture et des limites liées au type de données (données administratives, données d'enquête, données de recensement). Certains de ces programmes statistiques et différences relatives à la BDIM sont décrits dans la présente section. On utilise la BDIM de 2013 pour procéder à des comparaisons.

8.4.1 Banque de données administratives longitudinales (DAL)

La Banque de données administratives longitudinales^{Note 12} (DAL) (LAD) est un échantillon longitudinal de 20 % des déclarants canadiens. Elle est couplée à la BDIM pour inclure un échantillon de 20 % des enregistrements de la BDIM et pour ajouter des variables propres aux immigrants, comme l'année d'admission, la catégorie d'immigration et l'état matrimonial à l'admission. Elle contient des renseignements sur les particuliers et sur les familles de recensement. Elle est utile aux analyses longitudinales, qui comparent le revenu et la mobilité des immigrants à ceux des déclarants canadiens. Toute analyse comparant des immigrants déclarants à la population de déclarants canadiens devrait se servir de cet ensemble de données.

La DAL contient un moins grand nombre de variables relatives à l'immigration que la BDIM. Les renseignements portant sur la période précédant l'admission, par exemple (comme le nombre de permis de travail et d'études), ne figurent pas dans la DAL. Les renseignements sur l'admission, notamment la profession envisagée et la province de destination, ne figurent pas non plus dans la DAL.

Le tableau 10 présente le revenu total moyen et médian (XTIRC) pour l'année d'imposition de 2012 des immigrants admis entre 1982 et 2013, par sexe, afin d'illustrer le degré de comparaison des estimations produites à partir de ces bases de données. Le revenu total moyen et médian par sexe, comme nous nous y attendons, est similaire pour les deux sources de données. Les différences peuvent s'expliquer par le fait que la DAL est un échantillon de 20 % de la population canadienne et que la BDIM est un recensement des immigrants déclarants couplés admis au Canada depuis 1980. Les chiffres de population diffèrent, mais ni l'une ni l'autre de ces sources ne devrait être utilisée pour des chiffres de population; la DAL étant un échantillon et la BDIM étant limitée aux immigrants déclarants. La population de la DAL est estimée en multipliant les enregistrements par un facteur de pondération de 5.

Tableau 10
Comparabilité du revenu total de 2012 entre la DAL et la BDIM pour les immigrants admis entre 1982 et 2013
Sommaire du tableau
Le tableau montre les résultats de Comparabilité du revenu total de 2012 entre la DAL et la BDIM pour les immigrants admis entre 1982 et 2013. Population, Hommes, Femmes, Total, Moyenne et Médiane, calculées selon nombre et dollars unités de mesure (figurant comme en-tête de colonne).
	Population	Moyenne	Médiane	Population	Moyenne	Médiane	Population	Moyenne	Médiane
	Population	Hommes		Population	Femmes		Population	Total
	nombre	dollars		nombre	dollars		nombre	dollars
Particulier
BDIM	2 776 700	41 900	29 400	2 906 000	28 700	20 600	5 682 690	35 000	24 200
DAL	2 686 300	41 700	29 200	2 803 100	28 700	20 500	5 489 390	34 900	24 100
Famille
BDIM	Note ...: n'ayant pas lieu de figurer	73 700	56 300	Note ...: n'ayant pas lieu de figurer	69 900	51 400	Note ...: n'ayant pas lieu de figurer	71 700	53 700
DAL	Note ...: n'ayant pas lieu de figurer	73 800	56 500	Note ...: n'ayant pas lieu de figurer	69 700	51 500	Note ...: n'ayant pas lieu de figurer	71 700	53 900
... n'ayant pas lieu de figurer Note : BDIM : Base de données longitudinales sur l'immigration; DAL : Banque de données administratives longitudinales. Source : Statistique Canada. Base de données longitudinales sur l'immigration de 2013 et Banque de données administratives longitudinales de 2013.

Dans le tableau 11, la comparabilité a été limitée au revenu total pour 2012 des immigrants admis en 2011. Les différences estimées observées entre la BDIM et la DAL pour ce groupe sont supérieures à celles observées pour la population immigrante admise pour toute année entre 1980 et 2013. Cela peut s'expliquer par le fait que la population d'intérêt est moins importante et plus précise. Les estimations de la DAL sont dérivées des enregistrements inclus dans l'échantillon de 20 % des immigrants admis en 2011. Ces enregistrements ne correspondent pas toujours au 20 % de la population précise de la BDIM. Ils constituent probablement une proportion plus réduite de la population précise de la BDIM, puisque l'échantillon n'a pas été prélevé pour être représentatif de cette population particulière. Les estimations de la BDIM sont dérivées de la population immigrante couplée admise en 2011 et ayant produit une déclaration de revenus en 2012. Ainsi, les estimations de la DAL peuvent prendre des valeurs légèrement différentes de celles de la BDIM lors de l'examen de sous-ensembles de population.

Tableau 11
Comparabilité de revenu total moyen et médian pour 2012 des immigrants admis en 2011
Sommaire du tableau
Le tableau montre les résultats de Comparabilité de revenu total moyen et médian pour 2012 des immigrants admis en 2011. Hommes, Femmes, Total, Moyenne et Médiane, calculées selon dollars unités de mesure (figurant comme en-tête de colonne).
	Moyenne	Médiane	Moyenne	Médiane	Moyenne	Médiane
	Hommes		Femmes		Total
	dollars
Particulier
BDIM	30 100	22 400	18 900	14 100	24 300	17 800
DAL	29 500	22 100	18 700	13 900	23 900	17 500
Famille
BDIM	49 900	39 300	48 200	37 100	49 000	38 200
DAL	49 300	39 000	48 000	36 600	48 600	37 800
Note : BDIM : Base de données longitudinales sur l'immigration; DAL : Banque de données administratives longitudinales. Source : Statistique Canada. Base de données longitudinales sur l'immigration de 2013 et Banque de données administratives longitudinales de 2013.

8.4.2 Recensement

Le questionnaire détaillé du recensement et l'Enquête nationale auprès des ménages (ENM) de 2011 permettent de recueillir des données relatives aux immigrants. Ces données sont recueillies pour une portion de la population (reportez-vous à la description du programme du recensement pour connaître la proportion exacte; cette valeur a varié au cours du temps). On y recueille ainsi le lieu de naissance, le lieu de naissance des parents, le statut d'immigrant, l'année d'immigration, l'âge à l'immigration et la citoyenneté. Depuis le Recensement de 2016, la catégorie d'immigration est également disponible. Le recensement recueille des données sur les Canadiens des première, deuxième et plus anciennes générations, alors que la BDIM recueille uniquement des données sur les nouveaux arrivants et leur famille. Le recensement comprend également des données sur les minorités visibles, la scolarité, le logement et la langue pour l'année de recensement; à moins que l'année d'admission ne soit également une année de recensement, ce dernier ne présente pas ces renseignements pour l'année d'admission. Le recensement ne permet pas d'effectuer d'études longitudinales sur la situation économique ou la mobilité à long terme des immigrants. De plus amples détails sur le Programme du recensement figurent sur le site Web de Statistique Canada.

L'Enquête nationale auprès des ménages (ENM) de 2011 a permis d'estimer que plus de 4,6 millions d'immigrants vivant au Canada en 2011 avaient été admis entre 1981 et 2011. Le tableau 11 compare les estimations de la population immigrante par décennie d'admission selon l'ENM et le FRPN. Le FRPN de 2013 ne devrait pas être utilisé pour estimer les chiffres de population, même après suppression des enregistrements des personnes décédées. Le faire contribuerait à une surestimation de la population immigrante vivant au Canada admise entre 1981 et 2011, car le FRPN ne tient pas compte de l'émigration. De plus, le FRPN est un sous-ensemble de la population immigrante, puisque seuls les déclarants y sont inclus. Cela peut expliquer les chiffres de population plus faibles pour le FRPN que pour l'ENM pour la cohorte d'immigrants la plus récente (de 2001 à 2011). Le nombre d'immigrants au tableau 12 prend en considération le nombre de décès en utilisant la variable Death_indicator (décrit à la section 7.2.2).

Tableau 12
Comparabilité des estimations de population entre la Base de données longitudinales sur l'immigration et l'Enquête nationale auprès des ménages
Sommaire du tableau
Le tableau montre les résultats de Comparabilité des estimations de population entre la Base de données longitudinales sur l'immigration et l'Enquête nationale auprès des ménages. Les données sont présentées selon Décennie d'admission (titres de rangée) et Estimations de l'ENM et Estimations du FRPN pour 2013, calculées selon nombre unités de mesure (figurant comme en-tête de colonne).
Décennie d'admission	Estimations de l'ENM	Estimations du FRPN pour 2013
Décennie d'admission	nombre
1981 à 1990	949 890	1 052 650
1991 à 2000	1 539 055	1 896 235
2001 à 2011	2 154 985	2 120 290
Total	4 643 930	5 069 175
Note : BDIM : Base de données longitudinales sur l'immigration; ENM : Enquête nationale auprès des ménages; FRPN : Fichier intégré des résidents permanents et non permanents. Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2013 et Enquête nationale auprès des ménages de 2011.

8.4.3 Enquête longitudinale auprès des immigrants du Canada (ELIC)

L'Enquête longitudinale auprès des immigrants du Canada (ELIC) vise à fournir des renseignements sur la manière dont les nouveaux immigrants s'adaptent à la vie au Canada et à comprendre les facteurs pouvant faciliter ou empêcher cette adaptation. L'ELIC est conçue pour examiner les quatre premières années de l'établissement. On a recueilli en trois vagues les données relatives à des immigrants de 15 ans et plus admis au Canada entre le 1er octobre 2000 et le 30 septembre 2001. L'ELIC permet d'étudier les compétences linguistiques, le logement, la scolarité, la reconnaissance des diplômes étrangers, l'emploi, la santé, les valeurs et les attitudes, l'établissement et l'utilisation des réseaux sociaux, le revenu et les perceptions relatives à l'établissement au Canada. La BDIM contient des caractéristiques comme la scolarité et la langue uniquement à l'admission, alors que l'ELIC permet une évaluation de l'évolution au cours du temps. De plus amples détails sur l'ELIC figurent sur le site Web de Statistique Canada.

Selon l'ELIC, il a été estimé que 164 200 immigrants âgés de 15 ans et plus ont été admis au Canada entre le 1er octobre 2000 et le 30 septembre 2001. L'estimation de cette même population est 156 670 selon la BDIM de 2013 en utilisant des calculs basés sur le FRPN (tableau 13). Une partie de la différence est due à la fois à l'exclusion des non-déclarants de l'estimation du FRPN et à l'émigration n'ont capturée au sein de la BDIM. Une autre partie s'explique par le fait que l'ELIC est une enquête introduisant des estimations de variance. Comme le montre le tableau 14, les proportions de la couverture selon la tranche d'âge varient en fonction de la tranche d'âge, même si la population de l'ELIC est en âge de déclarer des revenus. Il convient de noter que l'âge dans l'ELIC est celui environ six mois après l'admission, alors que l'âge dans la BDIM est celui à l'admission. De plus, le calcul des estimations de l'ELIC est fondé sur les facteurs de pondération de la première vague, conçus pour estimer le nombre d'immigrants dans cette cohorte vivant toujours au Canada six mois après leur admission. La proportion inférieure d'immigrants âgés de 65 ans et plus pourrait être due à une proportion inférieure de déclarants pour cette tranche d'âge. Le nombre d'immigrants âgés de 15 à 24 ans plus élevé dans la BDIM que dans l'ELIC s'explique probablement par la non-prise en compte de l'émigration.

Tableau 13
Répartition par sexe : comparaison de la Base de données longitudinales sur l'immigration et de l'Enquête longitudinale auprès des immigrants du Canada
Sommaire du tableau
Le tableau montre les résultats de Répartition par sexe : comparaison de la Base de données longitudinales sur l'immigration et de l'Enquête longitudinale auprès des immigrants du Canada. ELIC de 2003 et FRPN de 2013, calculées selon nombre et pourcentage unités de mesure (figurant comme en-tête de colonne).
	nombre	pourcentage	nombre	pourcentage
	ELIC de 2003		FRPN de 2013
Hommes	81 550	49,7	77 640	49,6
Femmes	82 650	50,3	78 830	50,4
Total	164 200	100,0	156 470	100,0
Note : ELIC : Enquête longitudinale auprès des immigrants du Canada; FRPN : Fichier intégré des résidents permanents et non permanents. Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2013 et Enquête longitudinale auprès des immigrants du Canada, 1^re vague, 2003.

Tableau 14
Répartition par tranche d'âge : comparaison de la Base de données longitudinales sur l'immigration et de l'Enquête longitudinale auprès des immigrants du Canada
Sommaire du tableau
Le tableau montre les résultats de Répartition par tranche d'âge : comparaison de la Base de données longitudinales sur l'immigration et de l'Enquête longitudinale auprès des immigrants du Canada. Les données sont présentées selon Tranche d'âge (titres de rangée) et ELIC de 2003 et FRPN de 2013, calculées selon nombre et pourcentage unités de mesure (figurant comme en-tête de colonne).
Tranche d'âge	ELIC de 2003		FRPN de 2013
Tranche d'âge	nombre	pourcentage	nombre	pourcentage
15 à 24 ans	26 730	16,3	27 990	17,9
25 à 34 ans	65 500	39,9	63 050	40,3
35 à 49 ans	53 970	32,9	49 030	31,3
50 à 64 ans	12 890	7,8	12 280	7,8
65 ans et plus	5 100	3,1	4 120	2,6
Total	164 200	100,0	156 470	100,0
Note : ELIC : Enquête longitudinale auprès des immigrants du Canada; FRPN : Fichier intégré des résidents permanents et non permanents. Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2013 et Enquête longitudinale auprès des immigrants du Canada, 1^re vague, 2003.

9 Nouvelles analyses possibles grâce à la BDIM

La BDIM a été créée pour permettre d'effectuer une analyse de sujets reliés à l'immigration; cette section présente un aperçu des analyses possibles grâce aux renseignements supplémentaires désormais disponibles dans la BDIM. Comme le décrit le présent rapport, le contenu de la BDIM a évolué; cela a accru ses capacités analytiques. Trouvez ci-après des exemples d'analyses que la BDIM permet d'effectuer.

9.1 Possibilités analytiques découlant des données relatives aux résidents non permanents

L'ajout des données relatives aux résidents non permanents élargit la portée de l'analyse que permet actuellement la BDIM. Les renseignements de nombre et de type de permis obtenus avant l'admission peuvent permettre d'établir le profil avant leur admission des immigrants ayant une expérience avant leur admission. De plus, les données relatives aux résidents non permanents peuvent être utilisées pour recenser les résidents permanents ayant ou non une expérience au Canada avant leur admission. En comparant ces populations (avec ou sans expérience au Canada avant l'admission), il est possible d'évaluer les répercussions de l'expérience au Canada avant l'admission sur la situation économique et sur les tendances de mobilité des immigrants. Le profil socioéconomique particulier au moment de la délivrance du permis de résidence temporaire est également désormais disponible et permet d'évaluer la situation économique et la mobilité avant l'admission. L'évolution de la profession envisagée, du niveau de compétence et du niveau de scolarité en fonction de la délivrance de permis de résidence temporaire est également disponible.

9.2 Possibilités analytiques grâce aux données relatives aux décès

L'ajout au FRPN des variables d'indicateur, de mois et d'année de décès permet d'estimer la proportion d'enregistrements inclus dans la BDIM qui concernent des immigrants décédés. Ces variables complètent la variable d'année de décès (YOD) des fichiers de données fiscales. La variable YOD est uniquement présente dans les cas où un formulaire T1 a été rempli de façon posthume au nom de la personne décédée, alors que l'année et le mois du décès figurent dans tout enregistrement couplé à l'ensemble de données sur la mortalité, quel que soit le profil de déclaration de revenus. De nouvelles analyses possibles peuvent inclure l'évaluation de profils économiques avant le décès et l'étude des attentes relatives à la vie après l'admission, par catégorie d'immigration et profil économique.

9.3 Capacités analytiques avec les données sur la citoyenneté

L'ajout de renseignements sur la citoyenneté à la BDIM offre plus de possibilités d'analyse. L'addition de l'année et du mois de citoyenneté canadienne permet de savoir si et quand les immigrants ont obtenu leur citoyenneté. Elle sert également de variable explicative supplémentaire pour l'étude des résultats socioéconomiques ou de la démographie. Par exemple, le taux d'obtention de la citoyenneté donne une idée de la proportion d'immigrants qui obtiennent la citoyenneté et des caractéristiques associées à la demande de citoyenneté. De plus, nous pouvons examiner le nombre d'années après l'arrivée pour l'obtention de la citoyenneté et l'âge au moment de l'obtention de la citoyenneté. Veuillez noter que les données la citoyenneté sont disponibles à partir de 2005.

10 Résumé

La BDIM est un ensemble de données combinant des enregistrements sur l'immigration et les impôts à des fins d'analyses socioéconomiques et relatives à la mobilité des immigrants (avec ou sans expérience avant l'admission) admis au Canada depuis 1980. La BDIM permet d'effectuer des analyses concernant les déclarants. C'est un point important, car les déclarants peuvent présenter un profil différent des non-déclarants. Le présent rapport technique a été élaboré pour fournir une description complète de la qualité des données de la BDIM ainsi que des modifications récemment apportées à cette base de données.

Comment accéder à la BDIM :

Comme le décrit la section 6, plusieurs produits sont à la disposition des chercheurs. Ils sont accessibles sur le site Web de Statistique Canada en sélectionnant « Diversité ethnique et immigration » comme sujet, puis Base de données longitudinales sur l'immigration (BDIM) sous Produits vedettes.

Il est à noter que les mises à jour annuelles de la BDIM sont indépendantes les unes des autres. D'année en année, il y a des changements aux processus de création des données, incluant à l'Identificateur personnel unique (IMDB_ID).

Annexes

A) Liens vers les principaux documents et pages Web relatifs à la BDIM

Dictionnaires (composantes sur les impôts et l'immigration) : Disponible aux utilisateurs de données ou sur demande en communiquant avec Statistique Canada par courriel à l'adresse STATCAN.infostats-infostats.STATCAN@canada.ca.

Historique de la BDIM : http://www23.statcan.gc.ca/imdb/p2SV_f.pl?Function=getInstanceList&Id=7196

Publications de la BDIM dans Le Quotidien : https://www120.statcan.gc.ca/stcsr/fr/ms1/mss?start=0&showSum=hide&fq=ds%3Adailyf&enableElevation=true&q=Base+de+donn%C3%A9es+longitudinales+sur+l%27immigration&sort=score+desc

Analyses fondées sur la BDIM : https://www150.statcan.gc.ca/n1/fr/type/analyses?texte=Base+de+donn%C3%A9es+longitudinales+sur+l%27immigration

https://www.canada.ca/fr/sr/srb.html?q=base+de+longitudinales+immigration&wb-srch-sub=

Bonikowska, A. et Hou, F. 2015. Quelles caractéristiques du capital humain prédisent le mieux les gains des immigrants de la composante économique? Statistique Canada Publication 11F0019M, n^o 368. Disponible à l'adresse https://www150.statcan.gc.ca/n1/pub/11f0019m/11f0019m2015370-fra.htm

Hou, F. et Bonikowska, A. 2015. L'avantage en matière de gains des résidents temporaires ayant obtenu le droit d'établissement au Canada. Statistique Canada Publication n^o 11F0019M, n^o 370. Disponible à l'adresse https://www150.statcan.gc.ca/n1/pub/11f0019m/11f0019m2015370-fra.htm

Huystee, M. 2016. Mobilité interprovinciale : Taux de rétention et taux d'entrée nets immigrants admis de 2008 à 2013. IRCC Rapports de recherche. Disponible à l'adresse https://www.canada.ca/fr/immigration-refugies-citoyennete/organisation/rapports-statistiques/recherche/mobilite-interprovinciale-retention-entree-immigrants-admis-2008-2013.html

Picot, G, et Lu, Y. 2017. Faible revenue chronique chez les immigrants au Canada et dans ses collectivités. Statistique Canada. Disponible à l'adresse http://www150.statcan.gc.ca/n1/pub/11f0019m/11f0019m2017397-fra.htm

Indice des prix à la consommation (62-001-X) : https://www150.statcan.gc.ca/n1/fr/catalogue/62-001-X

Description des estimations annuelles du revenu des familles de recensement et des particuliers (Fichier sur la famille T1) : http://www23.statcan.gc.ca/imdb/p2SV_f.pl?Function=getSurvey&SDDS=4105&lang=fr&db=imdb&adm=8&dis=2.

B) Couverture

La BDIM de 2016 a été utilisée pour produire ces chiffres. Les déclarants sont des immigrants couplés ayant produit au moins une déclaration de revenus depuis 1982. Les statistiques ci-dessous excluent les admissions de 2017.

Tableau 15
Répartition des déclarants et des non déclarants par année d'admission
Sommaire du tableau
Le tableau montre les résultats de Répartition des déclarants et des non déclarants par année d'admission. Les données sont présentées selon Année d'admission (titres de rangée) et Déclarants, Non-déclarants, Total, Immigrants, RP, RP/RNP et Décès, calculées selon nombre et pourcentage unités de mesure (figurant comme en-tête de colonne).
Année d'admission	Déclarants^{Tableau 14 Note 1}				Non-déclarants				Total
	Immigrants	RP	RP/RNP	Décès	Immigrants	RP	RP/RNP	Décès	Immigrants	RP	RP/RNP	Déclarants
	nombre											pourcentage
1980	106 500	102 000	4 500	15 300	36 700	35 800	900	1 700	143 200	137 800	5 400	74,4
1981	98 500	85 900	12 600	13 800	30 000	28 000	2 000	1 500	128 500	113 900	14 600	76,7
1982	96 300	81 100	15 200	12 400	24 800	22 800	2 000	1 300	121 100	103 900	17 200	79,5
1983	71 200	57 400	13 800	10 000	17 900	16 300	1 600	1 100	89 100	73 700	15 400	79,9
1984	71 300	55 500	15 800	9 300	16 700	15 100	1 600	1 000	88 000	70 600	17 400	81,0
1985	69 400	54 000	15 400	8 100	14 500	13 100	1 400	700	83 900	67 100	16 800	82,7
1986	84 000	61 300	22 700	8 300	14 800	13 100	1 700	600	98 800	74 400	24 400	85,0
1987	130 700	97 500	33 200	10 300	20 400	18 300	2 100	700	151 100	115 800	35 300	86,5
1988	142 300	125 200	17 100	9 900	18 500	17 100	1 400	600	160 800	142 300	18 500	88,5
1989	170 000	145 500	24 500	10 300	20 700	19 200	1 500	600	190 700	164 700	26 000	89,1
1990	192 300	158 300	34 000	10 900	23 200	21 500	1 700	600	215 500	179 800	35 700	89,2
1991	208 700	137 300	71 400	11 800	23 100	20 300	2 800	600	231 800	157 600	74 200	90,0
1992	228 900	144 300	84 600	11 800	25 100	21 600	3 500	500	254 000	165 900	88 100	90,1
1993	230 800	165 200	65 600	11 000	24 900	22 000	2 900	500	255 700	187 200	68 500	90,3
1994	198 600	159 900	38 700	8 800	25 000	23 200	1 800	400	223 600	183 100	40 500	88,8
1995	188 500	148 000	40 500	7 000	23 600	21 900	1 700	300	212 100	169 900	42 200	88,9
1996	198 200	155 800	42 400	6 100	27 100	25 400	1 700	300	225 300	181 200	44 100	88,0
1997	188 800	152 800	36 000	5 000	26 600	25 100	1 500	300	215 400	177 900	37 500	87,7
1998	154 900	122 700	32 200	3 700	18 800	17 500	1 300	200	173 700	140 200	33 500	89,2
1999	167 800	133 200	34 600	3 500	21 600	20 200	1 400	200	189 400	153 400	36 000	88,6
2000	200 800	161 000	39 800	3 600	25 900	24 400	1 500	200	226 700	185 400	41 300	88,6
2001	219 500	180 300	39 200	3 700	30 200	28 700	1 500	200	249 700	209 000	40 700	87,9
2002	197 500	164 300	33 200	3 200	30 700	29 400	1 300	200	228 200	193 700	34 500	86,5
2003	188 800	155 400	33 400	2 700	31 700	30 400	1 300	200	220 500	185 800	34 700	85,6
2004	199 100	155 800	43 300	2 200	36 300	34 500	1 800	190	235 400	190 300	45 100	84,6
2005	217 700	167 700	50 000	1 800	44 100	41 700	2 400	120	261 800	209 400	52 400	83,2
2006	208 400	154 000	54 400	1 900	42 700	40 200	2 500	150	251 100	194 200	56 900	83,0
2007	193 700	141 200	52 500	1 500	42 500	40 000	2 500	130	236 200	181 200	55 000	82,0
2008	198 900	144 200	54 700	1 300	47 700	45 200	2 500	160	246 600	189 400	57 200	80,7
2009	202 200	144 200	58 000	1 200	49 400	46 600	2 800	150	251 600	190 800	60 800	80,4
2010	218 000	157 200	60 800	1 000	62 100	58 600	3 500	130	280 100	215 800	64 300	77,8
2011	190 800	136 200	54 600	800	57 300	53 400	3 900	100	248 100	189 600	58 500	76,9
2012	198 500	137 200	61 300	700	58 700	54 600	4 100	110	257 200	191 800	65 400	77,2
2013	198 000	133 100	64 900	600	60 500	55 900	4 600	120	258 500	189 000	69 500	76,6
2014	197 000	114 000	83 000	300	62 500	56 900	5 600	70	259 500	170 900	88 600	75,9
2015	197 200	113 600	83 600	175	73 800	67 500	6 300	60	271 000	181 100	89 900	72,8
2016	190 800	110 400	80 400	80	104 600	96 400	8 200	60	295 400	206 800	88 600	64,6
Total	6 414 600	4 812 700	1 601 900	214 055	1 314 700	1 221 900	92 800	16 050	7 729 300	6 034 600	1 694 700	83,0
Note 1 Les déclarants sont des immigrants couplés ayant produit au moins une déclaration de revenus depuis 1982. Retour à la référence de note 1 Notes : RP : résident permanent; RNP : résident non permanent. Tous les chiffres sont arrondis. Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2016.

Tableau 16
Proportion de déclarants couplés par tranche d'âge à l'admission, sexe et décennie d'admission
Sommaire du tableau
Le tableau montre les résultats de Proportion de déclarants couplés par tranche d'âge à l'admission. Les données sont présentées selon Sexe et cohortes (titres de rangée) et Âge à l'admission, 0 à 14 ans, 15 à 24 ans, 25 à 34 ans, 35 à 44 ans, 45 à 64 ans, 65 ans et plus et Total, calculées selon pourcentage unités de mesure (figurant comme en-tête de colonne).
Sexe et cohortes	Âge à l'admission
	0 à 14 ans	15 à 24 ans	25 à 34 ans	35 à 44 ans	45 à 64 ans	65 ans et plus	Total
	pourcentage
Cohortes de 1980 à 1989
Hommes	73,0	87,5	92,1	92,0	83,0	60,4	84,6
Femmes	71,9	83,1	89,0	89,9	78,1	57,0	81,2
Total	72,5	85,2	90,6	91,0	80,2	58,5	82,9
Cohortes de 1990 à 1999
Hommes	81,0	92,9	93,1	92,8	90,0	76,8	89,6
Femmes	79,4	91,4	92,7	92,8	88,0	75,4	88,7
Total	80,2	92,1	92,9	92,8	88,9	76,0	89,1
Cohortes de 2000 à 2009
Hommes	53,9	92,9	91,8	92,8	92,9	89,0	83,6
Femmes	53,0	92,4	92,7	93,6	92,6	87,2	84,7
Total	53,5	92,6	92,3	93,2	92,8	88,0	84,2
Cohortes de 2010 à 2016
Hommes	8,6	85,6	93,6	92,1	89,4	84,0	73,1
Femmes	8,7	87,3	93,6	93,0	88,5	82,6	75,5
Total	8,7	86,5	93,6	92,5	88,9	83,3	74,4
Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2016.

C) Analyses précédentes

Depuis sa création, la BDIM a permis de produire plusieurs analyses. Trouvez ci-après un résumé de certaines des études de Statistique Canada fondées sur la BDIM.

Ces dernières années, plusieurs publications du Quotidien se sont basées sur la BDIM. Les sujets discutés ont inclus l'évolution de la répartition régionale des nouveaux immigrants au Canada, le revenu et la mobilité des immigrants, les immigrants dans les régions et les immigrants qui quittent le Canada. Ces articles sont accessibles sur le site Web de Statistique Canada.

Les séries de publications L'emploi et le revenu en perspective (75-001-X) et de documents de recherche de la Direction des études analytiques ont proposé plusieurs documents fondés sur la BDIM. Parmi les sujets couverts, on peut citer le revenu des immigrants qui entreprennent des études postsecondaires au Canada et les avantages en matière de revenu des immigrants admis ayant été auparavant résidents temporaires au Canada.

D) Pratiques exemplaires et conseils pour les analystes

D.1 Conseils de programmation

Cette section offre des renseignements relatifs à la programmation pour les personnes souhaitant mieux comprendre la structure de programmation utilisée pour accéder aux données des fichiers de la BDIM. Toute personne peut utiliser sa propre programmation. Il existe deux types de fichiers au sein de la BDIM : les fichiers de données annuelles de la BDIM et les données sur l'immigration (pour de plus amples détails sur les fichiers constituant la BDIM, reportez-vous à la section 3). Le nom des variables relatives à l'impôt dans la BDIM consiste en trois parties : 1) le sigle indiqué dans le dictionnaire sur les données fiscales de la BDIM, 2) le niveau d'agrégation (I ou F) et 3) l'année (l'extension de l'année à quatre chiffres existe dans la plupart des cas, mais pas tous).

Exemple : La variable de revenus d'intérêts et d'investissements au niveau individuel pour 2014 serait intitulée INVI_I2014.

Les observations contenues dans les fichiers de la BDIM sont triées en fonction d'une variable, IMDB_id (qui ne comprend pas d'extension d'année), permettant aux utilisateurs de maintenir un lien entre les années. L'accès aux données est rendu possible par le langage de programmation SAS. Un exemple de programme SAS permettant d'accéder aux données de la BDIM est fourni ci-dessous. Les exemples ci-dessous permettent d'effectuer la tâche suivante :

« obtenir le nombre de bénéficiaires d'aide sociale (AS) parmi les immigrants admis entre 2000 et 2005, vivant en Ontario entre 2010 et 2012 et pour lesquels aucun revenu ne figurait sur leur feuillet T4, par sexe et année (de 2010 à 2012) ».

Nous encourageons les chercheurs utilisant nouvellement la BDIM à passer cet exemple de programme SAS en revue. L'exemple comprend généralement trois composantes :

la configuration de la bibliothèque : les attributions de bibliothèque sur les deux premières lignes sont les emplacements des fichiers d'entrée (première ligne) et de sortie (deuxième ligne);
les étapes permettant de générer un ensemble de données de travail :
1. Les fichiers d'entrée étant au format SAS, ils sont accessibles au moyen d'une instruction SET ou MERGE.
2. Ce programme vise à obtenir le nombre de bénéficiaires d'aide sociale (AS) parmi les immigrants :
  1. admis entre 2000 et 2005;
  2. vivant en Ontario de 2010 à 2012;
  3. dont le feuillet T4 n'indiquait aucun revenu;
    et génère le nombre de bénéficiaires d'aide sociale, par sexe et année (dans ce cas, de 2010 à 2012);
l'ensemble de données utilisé pour produire le nombre de bénéficiaires d'aide sociale. Cette partie, qui commence par « proc freq », produit les chiffres souhaités, tels qu'ils sont précisés dans le reste du document. À la fin du programme, quatre tableaux sont générés à partir du fichier de données créé.

Il est généralement recommandé que les programmes utilisent des variables figurant dans le FRPN plutôt que dans les fichiers de données fiscales annuelles, par souci de cohérence. L'exemple de programme utilise, par exemple, la variable de groupement par sexe GENDER, variable figurant dans le FRPN (PNRF), plutôt que SXCO_I&year, variable figurant dans le fichier IMDB_T1FF annuel. Dans ce programme, seules les personnes ayant rempli une déclaration chaque année entre 2000 et 2002 sont sélectionnées.

Lors de toute programmation dans SAS, il est important de distinguer les valeurs manquantes des zéros présents dans les champs numériques. Dans SAS, la plupart des opérations mathématiques effectuées avec des valeurs manquantes produiront des valeurs manquantes. Dans la BDIM, pour les années au cours desquelles une personne est présente, les variables numériques qui ne s'appliquent pas à cette personne prennent la valeur zéro « 0 ». Par exemple, si une personne sans conjoint a déclaré un revenu en 2010, la valeur de la variable RRSPSI2010 (contributions au REER d'un conjoint) devrait être zéro « 0 ». Si cette personne n'avait pas produit de déclaration de revenus en 2010, la valeur serait manquante.

Exemple de programme pour la BDIM

* Exemple de programme SAS pour la BDIM



libname source1 '\\f8prod05\cic\1.Database'; * emplacement des fichiers de la BDIM ;



libname Out '\\f8prod05\cic\3.workarea'; * répertoire de l'utilisateur ;



* L'objectif de ce programme est d'utiliser la BDIM pour obtenir le nombre de personnes recevant des prestations d'aide sociale, vivant en Ontario, pour lesquelles aucun revenu d'emploi ne figurait sur leur feuillet T4, selon le sexe et l'année (dans ce cas, de 2010 à 2012). Les données relatives aux provinces et aux revenus proviennent des fichiers annuels de la BDIM, alors que la variable relative au sexe provient du fichier PNRF_2014 (FRPN). ;



* La première étape est de créer un fichier de données contenant toute l'information nécessaire à la création de nos tableaux. Ce fichier est nommé SAOnt et est enregistré dans le répertoire de sortie. L'identifiant longitudinal (IMDB_ID) est utilisé pour fusionner les ensembles de données annuels de la BDIM. ;



data out.SAOnt;
merge
source1.imdb_t1ff_2010(where=(prco_i2010 = 5 and outlier_ind2010 = 0) in=a keep=imdb_id prco_i2010 outlier_ind2010 saspyf2010 t4e__i2010)



source1.imdb_t1ff_2011(where=(prco_i2011 = 5 and outlier_ind2011 = 0) in=b keep= imdb_id prco_i2011 outlier_ind2011 saspyf2011 t4e__i2011)



source1.imdb_t1ff_2012(where=(prco_i2012 = 5 and outlier_ind2012 = 0) in=c keep= imdb_id prco_i2012 outlier_ind2012 saspyf2012 t4e__i2012)



source1.pnrf_2015(keep= imdb_id gender landing_year immigration_category);



by IMDB_id ;



If a and b and c and (landing_year>=2000 and landing_year<=2005);


 
* La personne doit avoir produit une déclaration de revenus pour chacune des trois années, ne pas être une valeur aberrante, et avoir été admise entre 2000 et 2005 (population d'intérêt).;



* On crée une variable dichotomique identifiant les bénéficiaires d'aide sociale pour chaque année. Cela produit trois variables :

flag_sa2010, flag_sa2011 et flag_sa2012, prenant la valeur 1 ou 0.;

If (t4e__i2010=0 and saspyf2010>0) then flag_sa2010 = 1 ;

else flag_sa2010 = 0 ;

if (t4e__i2011=0 and saspyf2011>0) then flag_sa2011 = 1 ;

else flag_sa2011 = 0 ;

if (t4e__i2012=0 and saspyf2012>0) then flag_sa2012 = 1 ;

else flag_sa2012 = 0 ;

run;



* La procédure 'freq' de SAS permet de produire nos tableaux. On doit ensuite s'assurer que les règles relatives à la confidentialité sont respectées. ;



proc freq data = out.SAOnt;

tables immigration_category*flag_sa2010*flag_sa2011*flag_sa2012 

gender*flag_sa2010*flag_sa2011*flag_sa2012 /missing ;

run;

* Fin de l'exemple de programmation.;

D.2 Création d'une cohorte

Avant de commencer l'analyse, il est essentiel de déterminer la cohorte d'intérêt. Cette cohorte peut être limitée par l'année d'admission, des variables géographiques ou toute autre variable d'intérêt (p. ex. la catégorie d'admission ou le sexe), selon les besoins du chercheur. Une cohorte unique clairement définie doit être choisie pour assurer la comparabilité. Un chercheur peut s'intéresser, par exemple, aux femmes admises en 2000 et vivant au sein d'une famille ayant reçu l'aide sociale en 2001 (tableau 17). Une question d'étude relative à cette cohorte pourrait être « Quelle portion de cette cohorte a reçu l'aide sociale au cours des deux années suivantes (2002 et 2003)? » Il convient de noter que l'Agence du revenu du Canada (ARC) exige que le conjoint recevant le revenu net le plus élevé déclare le versement de l'aide sociale. Par conséquent, il est conseillé de générer la mesure de l'aide sociale (SASPY_F), y compris pour les particuliers, à partir des données au niveau familial.

Tableau 17
Exemple : Femmes admises en 2002 ayant reçu l'aide sociale (SASPY_F) en 2001
Sommaire du tableau
Le tableau montre les résultats de Exemple : Femmes admises en 2002 ayant reçu l'aide sociale (SASPY_F) en 2001. Les données sont présentées selon IMDB_ID (titres de rangée) et Année d'admission, Sexe, SASPY_F2001, SASPY_F2002 et SASPY_F2003, calculées selon dollars unités de mesure (figurant comme en-tête de colonne).
IMDB_ID	Année d'admission	Sexe	SASPY_F2001	SASPY_F2002	SASPY_F2003
IMDB_ID	Année d'admission	Sexe	dollars
IM583	2000	Femme	20 500	19 000	14 000
IM145	2000	Femme	3 000	0	0
IM548	2000	Femme	11 500	13 800	0
IM798	2000	Femme	16 000	18 000	8 000
IM961	2000	Femme	10 000	0	0
IM967	2000	Femme	9 500	0	0
IM110	2000	Femme	5 000	2 000	1 000
IM125	2000	Femme	1 000	0	200
Source : Statistique Canada, exemple provenant de la base de données longitudinales sur l'immigration (BDIM).

D.3 Calcul des taux de rétention

L'un des principaux avantages de la BDIM est qu'elle comprend des variables géographiques permettant d'étudier la mobilité et la rétention. Aucune autre base de données ne présente un niveau comparable de détails annuels relatifs aux déclarants, en particulier pour des régions plus réduites. Disposer de mises à jour annuelles au niveau des provinces, des divisions de recensement, des régions métropolitaines de recensement, des agglomérations de recensement, des subdivisions de recensement et des secteurs de recensement permet une vaste gamme d'analyses.

Il est possible d'étudier les trajectoires de mobilité individuelle en attribuant simplement des indicateurs aux changements de code postal et de calculer des tendances de mobilité en étudiant les déménagements à des niveaux géographiques donnés. La mobilité au niveau des subdivisions de recensement (changements de subdivision de recensement d'une année à l'autre) et la mobilité à l'échelle provinciale (changement de province d'une année à l'autre) varie de manière significative en fonction de plusieurs caractéristiques d'immigrant, comme l'âge et la catégorie d'admission. Ces données géographiques sont dérivées du code postal (variable PSCO dans la BDIM au niveau individuel et familial). Le code postal est un code alphanumérique à six caractères définissant le lieu de livraison du courrier adressé aux clients du service postal au Canada. Voir la section 3.4.1 pour une description des variables géographiques.

Dans l'exemple ci-dessous (tableau 18), le chercheur s'intéresse à la mobilité jusqu'en 2002. Les personnes IM798, IM961, IM967 et IM110 peuvent être exclues de l'étude sur la mobilité du fait de l'absence de données (ou de fichiers).

Tableau 18
Exemple : Mobilité jusqu'en 2002 des immigrants admis en 2000
Sommaire du tableau
Le tableau montre les résultats de Exemple : Mobilité jusqu'en 2002 des immigrants admis en 2000. Les données sont présentées selon IMDB_ID (titres de rangée) et Année d'admission, Province de destination, province de résidence 2000, province de résidence 2001 et province de résidence 2002(figurant comme en-tête de colonne).
IMDB_ID	Année d'admission	Province de destination	PRCO 2000	PRCO 2001	PRCO 2002
IM583	2000	C.-B.	C.-B.	C.-B.	C.-B.
IM145	2000	Alb.	Alb.	Sask.	Sask.
IM548	2000	Alb.	Ont.	Ont.	Ont.
IM798	2000	Ont.	Note ..: indisponible pour une période de référence précise	Ont.	Ont.
IM961	2000	N.-B.	N.-B.	N.-B.	Note ..: indisponible pour une période de référence précise
IM967	2000	Ont.	Note ..: indisponible pour une période de référence précise	Alb.	Ont.
IM110	2000	Note ..: indisponible pour une période de référence précise	Qc	Note ..: indisponible pour une période de référence précise	Qc
.. indisponible pour une période de référence précise Note : PRCO : province de résidence Source : Statistique Canada, exemple provenant de la base de données longitudinales sur l'immigration.

Alors que la mobilité au niveau individuel est relativement simple, le taux de rétention des immigrants dans un territoire peut être calculé de diverses manières. La façon de calculer cette rétention est une décision analytique fondée sur les besoins particuliers du chercheur. Il est relativement simple de définir le nombre de personnes restant : il s'agit du nombre de personnes produisant une déclaration de revenus dans le territoire d'intérêt à un moment donné. Il est nécessaire de prendre une décision quant à la cohorte initiale d'admission pour laquelle le chiffre de rétention est calculé (le dénominateur du taux de rétention).

Les taux de rétention indiquent la proportion des immigrants déclarants résidant dans la province où ils ont été admis (définie comme la province de destination envisagée) à un moment donné. Pour une cohorte donnée (p. ex. l'année d'admission) et une année d'imposition donnée (ou un certain nombre d'années depuis l'admission), le dénominateur est le nombre de déclarants correspondant à la province d'admission sélectionnée. Le numérateur est le nombre de déclarants correspondant à la province d'admission sélectionnée qui résident également dans cette province.

Pour calculer les taux de rétention de la cohorte de 2011 trois ans après l’admission, un chercheur préparerait un tableau, avectoutes les provinces d’admission (p. ex. la province de destination envisagée), toutes les provinces de résidence, l’année d’admission = 2011 et l’année de référence = 2014. Ce tableau ressemblerait au suivant :

Tableau 19
Province de résidence en 2014 et province d'admission, cohorte de 2011
Sommaire du tableau
Le tableau montre les résultats de Province de résidence en 2014 et province d'admission. Les données sont présentées selon Province d'admission (titres de rangée) et Province de résidence, Total – Province de résidence, Terre-Neuve-et-Labrador, Île-du-Prince-Édouard, Nouvelle-Écosse, Nouveau-Brunswick, Québec, Ontario, Manitoba, Saskatchewan, Alberta, Colombie-Britannique et Autre lieu de résidence, calculées selon nombre d'immigrants unités de mesure (figurant comme en-tête de colonne).
Province d'admission	Province de résidence
	Total – Province de résidence	Terre-Neuve-et-Labrador	Île-du-Prince-Édouard	Nouvelle-Écosse	Nouveau-Brunswick	Québec	Ontario	Manitoba	Saskatchewan	Alberta	Colombie-Britannique	Autre lieu de résidence
	nombre d'immigrants
Total – Province d'admission	174 740	405	330	1 365	880	31 505	70 590	9 695	6 120	26 965	26 390	500
Terre-Neuve-et-Labrador	515	325	0	5	0	5	75	5	0	60	30	0
Île-du-Prince-Édouard	1 245	0	265	25	10	30	560	0	0	50	295	0
Nouvelle-Écosse	1 460	10	5	1 080	10	25	185	0	5	90	30	10
Nouveau-Brunswick	1 340	0	10	35	750	55	275	0	10	80	120	0
Québec	36 275	10	10	35	15	30 200	3 255	40	75	1 190	1 400	45
Ontario	69 135	35	25	115	70	875	63 145	275	335	2 815	1 325	115
Manitoba	11 190	0	0	15	0	55	645	9 170	80	825	380	10
Saskatchewan	6 360	0	0	0	0	20	295	45	5 370	445	165	10
Alberta	21 940	10	0	20	0	95	810	65	140	20 170	590	35
Colombie-Britannique	25 000	5	0	30	5	140	1 330	85	100	1 200	22 030	70
Autre	280	0	0	0	0	0	15	0	0	35	20	200
Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2014.

Les résultats pour la Nouvelle-Écosse donnent des renseignements à ce sujet. Au total, 1 460 personnes ont été admises en Nouvelle-Écosse en 2011 et ont produit une déclaration de revenus en 2014. Pour 1 080 de ces personnes, la Nouvelle-Écosse figurait comme province de résidence en 2014. Le taux de rétention sur trois ans pour la Nouvelle-Écosse serait 1 080/1 460, soit environ 74 %. Tableau 18 fournit également des renseignements sur les migrants secondaires^{Note 13} : 1 365 personnes admises en 2011 résidaient en Nouvelle-Écosse en 2014; parmi ces dernières, 1 080 envisageaient de résider en Nouvelle-Écosse et 285 avait indiqué une autre province de destination.

La définition susmentionnée de rétention part du principe que le nombre de déclarants pour la province donnée de destination envisagée est la population totale pouvant y rester au cours d'une année (c.-à-d., si les 1 460 personnes ayant envisagé de résider en Nouvelle-Écosse y avaient produit une déclaration de revenus en 2014, la province aurait enregistré un taux de rétention de 100 %). Cette méthode ne tient pas compte des interruptions de déclarations ou des émigrants ayant quitté le Canada, pour lesquels aucune déclaration fiscale n'était disponible en 2014.

Une option est une approche purement longitudinale, selon laquelle on sélectionne une seule cohorte d'admission (selon la province de destination envisagée, la province de déclaration de revenus initiale, ou les deux) et le taux de rétention est calculé comme la portion de cette cohorte déclarant toujours ses revenus dans cette province. Lorsque la province de déclaration de revenus initiale est utilisée pour définir la cohorte d'admission, il est recommandé que la première déclaration de revenus ait lieu l'année d'admission des immigrants (année d'admission = année d'imposition), afin d'exclure les personnes arrivées ailleurs et ayant ensuite migré dans cette région avant de déclarer leurs revenus pour la première fois. Il est possible d'ajouter une autre restriction, si le chercheur s'intéresse à la population dont le lieu de destination correspond au lieu géographique de la première déclaration de revenus.

Étant donné qu'une portion de chaque cohorte ne déclare pas de revenus pour l'année d'admission, il peut être nécessaire d'accroître la taille de la population pour une région en définissant la cohorte d'admission comme toute personne ayant déclaré ses revenus pour la première fois dans la région au cours des deux années suivant son admission (c.-à-d., first_tax_year = landing_year ou landing_year+1). Il n'est pas recommandé d'inclure à la « cohorte d'admission » les personnes dont la première déclaration de revenus a eu lieu plusieurs années après leur admission, car il est possible que ces personnes soient d'abord arrivées ailleurs sans toutefois avoir déclaré de revenus. Il est également suggéré d'exclure les déclarants intermittents de ces analyses, car leur lieu de résidence n'est pas connu pour les années pour lesquelles aucune donnée fiscale n'existe. La rétention calculée de cette manière indiquera une diminution graduelle du nombre; cette diminution est due aux immigrants cessant de déclarer leurs revenus, émigrant ailleurs ou décédant.

Si un chercheur s'intéresse aux migrations secondaires vers une région, il est possible de l'évaluer en supprimant les personnes de la cohorte d'admission définie du nombre total d'immigrants déclarant des revenus dans la région au moment souhaité. Toutefois, à nouveau, il est suggéré de limiter ces analyses aux personnes ayant déclaré leurs revenus pour la première fois au cours de cette période (année 0 ou année 1), afin de ne pas prendre des déclarants tardifs pour des migrants dans la région. Si la cohorte d'admission est limitée aux immigrants dont la destination correspond au lieu de la première déclaration de revenus, il est suggéré de faire une autre distinction entre les migrants secondaires ayant produit leur première déclaration de revenus ailleurs (puis dans la région d'intérêt) et les immigrants ayant produit leur première déclaration de revenus dans la région d'intérêt, puis ayant été admis dans une autre région (ou lorsque toute donnée manque quant à leur destination envisagée).

Le tableau suivant présente un exemple d'une approche longitudinale de rétention provinciale utilisant des données fictives, selon diverses définitions de la cohorte d'admission initiale.

Tableau 20
Nombre d'immigrants déclarants au sein de la population en question résidant en Colombie-Britannique et taux de rétention associé, par année depuis l'admission
Sommaire du tableau
Le tableau montre les résultats de Nombre d'immigrants déclarants au sein de la population en question résidant en Colombie-Britannique et taux de rétention associé, par année depuis l'admission. Les données sont présentées selon Années depuis l'admission (titres de rangée) et Déclarants ayant pour la première fois déclaré des revenus en Colombie-Britannique au cours de l'année 0, Taux de rétention, Déclarants ayant pour la première fois déclaré des revenus en Colombie-Britannique au cours de l'année 0 au 1 et Déclarants ayant pour la première fois déclaré des revenus en Colombie-Britannique au cours de l'année 0 au 1 et pour lesquels la destination envisagée était la Colombie-Britannique, calculées selon nombre et pourcentage unités de mesure (figurant comme en-tête de colonne).
Années depuis l'admission	Déclarants ayant pour la première fois déclaré des revenus en C.-B. au cours de l'année 0	Taux de rétention	Déclarants ayant pour la première fois déclaré des revenus en C.-B. au cours de l'année 0 au 1	Taux de rétention	Déclarants ayant pour la première fois déclaré des revenus en C.-B. au cours de l'année 0 au 1 et pour lesquels la destination envisagée était la C.-B.	Taux de rétention
Années depuis l'admission	nombre	pourcentage	nombre	pourcentage	nombre	pourcentage
0	20 000	100	20 000	Note ...: n'ayant pas lieu de figurer	17 500	Note ...: n'ayant pas lieu de figurer
1	18 000	90	25 000	100	19 000	100
2	17 000	85	23 000	92	18 000	95
3	16 500	83	22 000	88	17 500	92
... n'ayant pas lieu de figurer Source : Statistique Canada, exemple provenant de la base de données longitudinales sur l'immigration.

Dans l'exemple ci-dessus, il est possible de calculer la rétention en Colombie-Britannique selon trois définitions de la population; le taux de rétention sur trois ans varie alors en fonction de la définition adoptée. Il est important que toutes les personnes de l'échantillon déclarent des revenus à chaque moment d'intérêt.

Avec la publication de la BDIM de 2016, un tableau récapitulatif sur la mobilité est disponible sur le site Web de Statistique Canada. Les mesures de mobilité comparent la destination prévue des fichiers d'immigration à la province de résidence obtenue à partir des déclarations de revenus. Par exemple, le tableau 21 présente les mesures de mobilité en fonction des différences entre la province de destination prévue des immigrants admis en 2010 et leur province de résidence en 2015 selon leur déclaration de revenus.

Tableau 21
Mesures de mobilité pour l'année d'admission 2010 selon la province, année d'imposition 2015
Sommaire du tableau
Le tableau montre les résultats de Mesures de mobilité pour l'année d'admission 2010 selon la province Total destination (a), Total résidence (b), Migration externe (c), Migration interne (d), Destiné et toujours résident (e=a-c), Taux de croissance de la population (f=b/a-1), Taux de rétention (g=e/a), Taux de migration externe (h=1-e/a) et Taux de migration interne (i=d/a) (figurant comme en-tête de colonne).
	Total destination (a)	Total résidence (b)	Migration externe (c)	Migration interne (d)	Destiné et toujours résident (e=a-c)	Taux de croissance de la population (f=b/a-1)	Taux de rétention (g=e/a)	Taux de migration externe (h=1-e/a)	Taux de migration interne (i=d/a)
Canada	200 600	200 600	27 260	27 260	173 340	0,0	86,4	13,6	13,6
Terre-Neuve-et-Labrador	525	410	245	130	280	-21,9	53,3	46,7	24,8
Île-du-Prince-Edward	1 930	370	1 630	70	305	-80,8	15,8	84,5	3,6
Nouvelle-Écosse	1 630	1 405	570	340	1 065	-13,8	65,3	35,0	20,9
Nouveau-Brunswick	1 535	920	795	180	740	-40,1	48,2	51,8	11,7
Québec	38 050	33 900	5 955	1 805	32 095	-10,9	84,4	15,7	4,7
Ontario	83 355	84 965	7 725	9 335	75 630	1,9	90,7	9,3	11,2
Manitoba	11 475	9 785	2 420	730	9 055	-14,7	78,9	21,1	6,4
Saskatchewan	5 620	5 410	1 220	1 015	4 400	-3,7	78,3	21,7	18,1
Alberta	24 255	29 850	2 360	7 955	21 895	23,1	90,3	9,7	32,8
Colombie-Britannique	31 820	32 790	4 250	5 215	27 575	3,1	86,7	13,4	16,4
Autre	405	420	95	115	305	3,7	75,3	23,5	28,4
Manquants	Note .. : indisponible pour une période de référence précise	365	Note .. : indisponible pour une période de référence précise	365	Note .. : indisponible pour une période de référence précise	0,0	0,0	0,0	0,0
.. indisponible pour une période de référence précise Source : Statistique Canada, Base de données longitudinales sur l'immigration 2015 (BDIM).

Le nouveau tableau fournit les mesures de mobilité suivantes :

La destination totale (colonne a) représente le nombre d'immigrants admis en 2010 et déclarant des taxes en 2015, au Canada;
La résidence totale (colonne b) représente le nombre d'immigrants déclarants en 2015 dans la province spécifiée;
La migration externe (colonne c) représente le nombre d'immigrants déclarants originaires de la province spécifiée et ayant produit leur déclaration dans une autre province, en 2015;
La migration interne (colonne d) représente le nombre d'immigrants originaires d'une province de destination différente et qui déclare des impôts dans la province spécifiée pour l'année 2015;
Le nombre de personnes destinés et toujours résidents (colonne e) représente le nombre d'immigrants déclarants qui a continué leur résidence dans la province de destination, pour l'année 2015;
Le taux de croissance de la population (colonne f) représente le pourcentage d'immigrants déclarants gagnés ou perdus par la province spécifiée. Cela tient compte des immigrants qui migrent à l'extérieur de la province et qui migrent dans la province spécifiée;
Le taux de rétention (colonne g) représente le pourcentage d'immigrants déclarants qui continueront de résider dans la province de destination, en 2015. Cela ne tient pas compte des immigrants qui arrivent d'une autre province de destination;
Le taux de migration externe (colonne h) représente le pourcentage d'immigrants déclarants originaires de la province spécifiée et qui déclare des impôts dans une autre province au cours de l'année 2015;
Le taux de migration interne (colonne i) représente le pourcentage d'immigrants originaires d'une autre province de destination et qui déclare des impôts dans la province spécifiée en 2015.

Le tableau 21 montre que 200 600 immigrants ont été admis au Canada en 2010 et ont produit une déclaration de revenus en 2015.

Des 83 355 immigrants déclarants qui avaient l'intention de résider en Ontario, 75 630 y sont demeurés en 2015, ce qui représente un taux de rétention de 90,7 %.

Alors que 7 725 immigrants déclarants ont quitté l'Ontario, 9 335 immigrants déclarants ont déménagé en Ontario à partir d'autres provinces de destination. Ainsi, pour cette cohorte de 2010, le nombre total de résidents de l'Ontario en 2015 était de 84 965, soit 1,9 % de plus que le nombre d'immigrants déclarants qui comptaient résider en Ontario.

Enfin, les analystes doivent procéder avec précaution lors de l'étude de divisions géographiques de faible niveau sur une longue période, car les frontières des agglomérations et des régions métropolitaines de recensement évoluent et des subdivisions de recensement sont abandonnées et ajoutées. Lorsque cela est possible, les analystes devraient exécuter le programme de Fichier de conversion des codes postaux (FCCP+) pour uniformiser les codes postaux en divisions géographiques constantes.

D.4 Calcul des trajectoires de revenu au cours du temps

Comme pour le taux de rétention, calculer l'évolution des revenus de salaires, traitements et commissions d'une année à l'autre (ou, d'ailleurs, toute variable économique) nécessite des données consécutives. Si un chercheur, par exemple, souhaite comparer le revenu de salaires, traitements et commissions médian de la cohorte de femmes âgées de 24 ans à 54 ans en 2000, un an après leur admission et cinq ans après leur admission (tableau 22), les enregistrements présentant des fichiers FFT1 manquants devraient être supprimés de l'analyse. La décision de supprimer ces enregistrements se baserait sur le souhait d'évaluer le revenu médian de la cohorte par rapport au revenu médian des déclarants de la cohorte.

Tableau 22
Revenu de salaires, traitements et commissions médian de la cohorte de femmes âgées de 24 à 54 ans en 2000, 1 an et 5 ans après l'admission
Sommaire du tableau
Le tableau montre les résultats de Revenu de salaires, traitements et commissions médian de la cohorte de femmes âgées de 24 à 54 ans en 2000, 1 an et 5 ans après l'admission. Les données sont présentées selon IMDB_ID (titres de rangée) et Année d'admission, Âge à l'admission, Sexe, Revenu de salaires 2001 et Revenu de salaires 2005, calculées selon dollars unités de mesure (figurant comme en-tête de colonne).
IMDB_ID	Année d'admission	Âge à l'admission	Sexe	Revenu de salaires 2001	Revenu de salaires 2005
IMDB_ID	Année d'admission	Âge à l'admission	Sexe	dollars
IM583	2000	34	Femme	20 500	49 000
IM145	2000	53	Femme	Note ..: indisponible pour une période de référence précise	56 000
IM548	2000	29	Femme	11 500	33 800
IM798	2000	31	Femme	36 000	0
IM961	2000	42	Femme	10 000	Note ..: indisponible pour une période de référence précise
IM967	2000	40	Femme	Note ..: indisponible pour une période de référence précise	Note ..: indisponible pour une période de référence précise
IM110	2000	35	Femme	0	59 000
.. indisponible pour une période de référence précise Source : Statistique Canada, exemple provenant de la base de données longitudinales sur l'immigration.

Des précautions doivent être prises lors du calcul du revenu pour la « première année au Canada », car il peut ne pas représenter une année d'imposition complète. Une personne admise, par exemple, en novembre 2013 et ayant déclaré des revenus pour 2013 ne déclarerait que deux mois de revenus en 2013. Une pratique exemplaire est d'utiliser la première année de revenu complète (année d'admission +1, voir le tableau 20). Une exception concerne les déclarants précoces, ayant déclaré des revenus au Canada avant leur admission ainsi que pour l'année d'imposition, car ils sont plus susceptibles de déclarer des revenus pour une année entière.

Il est également important d'étudier le revenu au cours du temps en dollars constants. Par conséquent, il est nécessaire d'apporter des ajustements à l'aide de l'Indice des prix à la consommation (IPC) (voir l'annexe D.7). Cet ajustement a été apporté dans les tableaux de la BDIM.

D.5 Arrondissement des données

Statistique Canada s'engage à respecter la vie privée des Canadiens. Par conséquent, tous les tableaux produits à partir des fichiers IMDB_TIFF font l'objet d'un arrondissement. L'intérêt de cet arrondissement est de veiller à ce qu'aucune cellule réduite ne soit divulguée pouvant révéler des renseignements sur des personnes données ou de petits groupes de personnes. En général, les macros prélèveront un ensemble de données d'entrée non arrondies de diverses statistiques (nombres, moyennes, médianes, etc.) et créeront un ensemble de données arrondi.

Les règles d'arrondissement sont mises à la disposition de l'ensemble des chercheurs ayant accès aux microdonnées dans les Centres de données de recherche (CDR).

D.6 Détection de valeurs aberrantes

La variable de valeur aberrante OUTLIER_IND a été créée pour détecter les valeurs aberrantes au sein du fichier FFT1 (voir la section 5.5). Elle devrait être utilisée pour supprimer les données aberrantes de tout calcul (p. ex. moyenne, médiane ou régression) utilisant des données fiscales. Les valeurs aberrantes varient d'une année à l'autre; ce qui signifie que les données relatives à une personne peuvent être détectées comme valeur aberrante pour une année, mais pas pour une année ultérieure.

Le tableau suivant présente la répartition des valeurs aberrantes dans les fichiers de données fiscales à partir de 1982, par type de résident, pour la BDIM de 2016. Moins de 0,05 % des enregistrements ont été relevés comme étant des valeurs aberrantes par année d'imposition. La proportion de valeurs aberrantes a augmenté de 1995 à 1996, du fait de mises à jour de la méthode de détection des valeurs aberrantes appliquée aux fichiers de données fiscales à partir de l'année d'imposition de 1997.

Tableau 23
Répartition des déclarants avec des valeurs aberrantes par année d'imposition
Sommaire du tableau
Le tableau montre les résultats de Répartition des déclarants avec des valeurs aberrantes par année d'imposition. Les données sont présentées selon Année (titres de rangée) et Total, calculées selon nombre et pourcentage unités de mesure (figurant comme en-tête de colonne).
Année	Total
Année	nombre	pourcentage
1982	20	0,01
1983	25	0,01
1984	45	0,01
1985	30	0,01
1986	75	0,02
1987	60	0,01
1988	100	0,01
1989	85	0,01
1990	80	0,01
1991	85	0,01
1992	165	0,01
1993	135	0,01
1994	85	0,01
1995	165	0,01
1996	500	0,03
1997	585	0,03
1998	705	0,03
1999	600	0,03
2000	670	0,03
2001	695	0,03
2002	655	0,02
2003	725	0,02
2004	1 030	0,03
2005	840	0,03
2006	900	0,03
2007	925	0,02
2008	1 000	0,03
2009	1 055	0,03
2010	1 205	0,03
2011	1 235	0,03
2012	1 035	0,02
2013	1 245	0,03
2014	1 155	0,02
2015	1 405	0,03
2016	1 100	0,02
Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2016.

D.7 Ajustement du revenu selon l'Indice des prix à la consommation (IPC)

Afin de tenir compte du coût de la vie, il est nécessaire d'ajuster tous les revenus en fonction de l'Indice des prix à la consommation (IPC) du Canada. « L'Indice des prix à la consommation (IPC) est un indicateur de la variation des prix à la consommation payés par les Canadiens. Pour l'établir, on compare au fil du temps le coût d'un panier fixe de biens et services achetés par les consommateurs. Puisque le panier comprend des biens et services d'une quantité et d'une qualité constante ou équivalente, l'indice reflète uniquement la fluctuation pure des prix^{Note 14}. » Les facteurs de correction pour 2016 sont présentés au tableau 24. Pour convertir les données en dollars constants d'une année donnée (année de référence), les utilisateurs de données doivent multiplier les valeurs en dollars de toutes les années, à l'exception de l'année de référence, par un facteur de correction propre à une année. Pour obtenir ces facteurs de correction, les utilisateurs de données doivent diviser l'IPC de l'année de référence par l'IPC de l'année étudiée. L'année de référence dans le tableau 24 est 2016.

Tableau 24
Facteur de correction de l'Indice des prix à la consommation de 2016
Sommaire du tableau
Le tableau montre les résultats de Facteur de correction de l'Indice des prix à la consommation de 2016. Les données sont présentées selon Année (titres de rangée) et L'ajustement de l'Indice des prix à la consommation de 2016 est égal à 128.4 divisé par, calculées selon nombre unités de mesure (figurant comme en-tête de colonne).
Année	L'ajustement de l'Indice des prix à la consommation de 2016 est égal à 128.4 divisé par
Année	nombre
1982	54,9
1983	58,1
1984	60,6
1985	63,0
1986	65,6
1987	68,5
1988	71,2
1989	74,8
1990	78,4
1991	82,8
1992	84,0
1993	85,6
1994	85,7
1995	87,6
1996	88,9
1997	90,4
1998	91,3
1999	92,9
2000	95,4
2001	97,8
2002	100,0
2003	102,8
2004	104,7
2005	107,0
2006	109,1
2007	111,5
2008	114,1
2009	114,4
2010	116,5
2011	119,9
2012	121,7
2013	122,8
2014	125,2
2015	126,6
2016	128,4
Source : Statistique Canada, tableau 18-10-0005-01.

D.8 Calcul de mesures de revenu clés

Les tableaux de la BDIM contiennent plusieurs mesures du revenu. Le tableau 25 décrit les variables du FFT1 incluses dans ces calculs.

Tableau 25
Description des principales mesures de revenu dans la Base de données longitudinales sur l'immigration
Sommaire du tableau
Le tableau montre les résultats de Description des principales mesures de revenu dans la Base de données longitudinales sur l'immigration. Les données sont présentées selon Mesure (titres de rangée) et Composantes et Formule (figurant comme en-tête de colonne).
Mesure	Composantes	Formule
Revenu de salaires, traitements et commissions	Revenu des feuillets T4; autre revenu d'emploi	T4E__i + OEI__i
Revenu de travail indépendant
Depuis 1988	Revenu provenant d'un travail indépendant comme des revenus d'entreprise, de profession libérale, de commissions, d'agriculture ou de pêche; revenu de société en commandite	SEI__i + LTPI_i
Avant 1988	Revenu provenant d'un travail indépendant comme des revenus d'entreprise, de profession libérale, de commissions, d'agriculture ou de pêche	SEI__i
Revenu de placements	Revenus d'intérêts et d'investissements; dividendes; gains et pertes en capital, net imposable	INVi_i + XDIV_i + CLKGX
Indemnités d'assurance-emploi	Indemnités d'assurance-emploi	EINS_i
Allocations sociales	Allocations sociales (utiliser le niveau familial)	SASPYf
Source : Statistique Canada, Base de données longitudinales sur I'immigration de 2016.

Il convient de noter que toutes les valeurs aberrantes sont supprimées de ces calculs (Outlier_ind=1), que l'on utilise la variable de province de résidence à la fin de l'année (PRCO_) pour déterminer la province et que tous les revenus sont corrigés en fonction de l'Indice des prix à la consommation (IPC) de l'année la plus récente pour laquelle le FFT1 est disponible. « Moyenne, avec revenu » désigne le revenu moyen des immigrants déclarants ayant un revenu du type donné. « Médiane, avec revenu » désigne le revenu médian des immigrants déclarants ayant un revenu du type donné.

Bibliographie

A. Carpentier et G. Pinsonneault. 1994. Representativeness Study of Immigrants Included in the Immigrant Data Bank (IMDB Project). Ministère des Affaires internationales, de l'Immigration et des Communautés culturelles. Gouvernement du Québec.

A. Diaz-Papkovich, IMDB Linkage Summary 2017. Document non publié. Ottawa, Statistique Canada, 2017.

Cascagnette, P., et SDLE production section. 2018. “Social Data Linkage Environment (SDLE) Methodology Report – Linkage between the Immigration File (1952- January 2018) and the SDLE Derived Record Depository (version 19)”. Document inédit. Ottawa : Statistique Canada.

Commission de l'immigration et du statut de réfugié du Canada, Section de la protection des réfugiés, 2015. Disponible à l'adresse http://www.irb-cisr.gc.ca/Fra/RefClaDem/Pages/RpdSpr.aspx (site consulté le 13 janvier 2016).

C. Langlois et C. Dougherty, La Base de données longitudinale sur l'immigration (BDIM): Une introduction. Recueil de la Conférence 1997 sur l'immigration, l'emploi et l'économie de Citoyenneté et Immigration Canada, 1997.

Dryburgh, H., La Banque de données administratives longitudinales (DAL) et la Banque de données longitudinales sur les immigrants (BDIM) : création de la DAL_BDIM - un document technique (n^o 89-612-XIE au catalogue) Ottawa, Statistique Canada, 2004. Disponible à l'adresse http://publications.gc.ca/collections/Collection/Statcan/89-612-X/89-612-XIF2003001.pdf (site consulté le 13 mars 2017).

Gouvernement du Canada, Déterminer son admissibilité – Citoyenneté, 2016. Disponible à l'adresse http://www.cic.gc.ca/francais/citoyennete/devenir-admissibilite.asp (site consulté le 20 juillet 2016).

Immigration, Réfugiés et Citoyenneté Canada, Rapport annuel au Parlement sur l'immigration, 2015. Disponible à l'adresse http://www.cic.gc.ca/francais/ressources/publications/rapport-annuel-2015/index.asp (site consulté le 10 juin 2016).

Immigration, Réfugiés et Citoyenneté Canada, Rapport sur les plans et priorités de 2015-2016, 2016. Disponible à l'adresse http://www.cic.gc.ca/francais/ressources/publications/rpp/2015-2016/index.asp (site consulté le 10 juin 2016).

J. Badets, et C. Langlois. 2000. « Les défis de l'utilisation de données administratives à l'appui de la recherche en matière de politiques: l'exemple de la base de données longitudinale sur l'immigration (BDIM) » Au Symposium 99 - Combiner des données de sources différentes, 1999. Symposium international de Statistique Canada: Recueil, produit n^o 11-522-XPE au catalogue de Statistique Canada.

M. Rotermann, C. Sanmartin, R. Trudeau, et H. St-Jean, « Couplage des données du Recensement de 2006 et des données hospitalières au Canada » Rapports sur la santé. Vol. 26, n^o 10 (n^o 82-003-X au catalogue) Ottawa, Statistique Canada, 2015. Disponible à l'adresse http://www.statcan.gc.ca/pub/82-003-x/2015010/article/14228-fra.pdf (site consulté le 13 mars 2017).

S.B. Dusetzina, S. Tyree, A.M. Meyer, A. Meyer, L. Green et W.R. Carpenter, Linking Data for Health Services Research: A Framework and Instructional Guide [Internet]. Préparé par l'Université de la Caroline du nord à Chapel Hill sous le contrat n^o 290-2010-000141. AHRQ Publication n^o 14-EHC033-EF. Rockville, MD: Agency for Healthcare Research and Quality, 2014 Disponible à l'adresse http://www.ncbi.nlm.nih.gov/books/NBK253312/ (site consulté le 14 mars 2017).

S. McLeish, 2008 IMDB Landing File: Data Quality Working Paper. Document non publié. Ottawa, Statistique Canada, 2011.

Statistique Canada, 150 ans d'immigration au Canada. Mégatendances canadiennes (n^o 11-630-X au catalogue) Ottawa, Statistique Canada, 2016. Disponible à l'adresse http://www.statcan.gc.ca/pub/11-630-x/11-630-x2016006-fra.htm (site consulté le 14 mars 2017).

Statistique Canada, Estimations annuelles du revenu des familles de recensement et des particuliers (Fichier des familles T1), 2018. Disponible à l'adresse http://www23.statcan.gc.ca/imdb/p2SV_f.pl?Function=getSurvey&SDDS=4105 (site consulté le 8 novembre 2017).

W.E. Winkler, « Record linkage » Sample Surveys: Design, Methods and Applications 29A, 2009, p. 351–380.

Notes

Note 1.

Auparavant Citoyenneté et Immigration Canada (CIC).

Retourner à la référence de note 1

Note 2.

Pour obtenir des renseignements sur le plus récent FFT1, consultez le site Web de Statistique Canada.

Retourner à la référence de note 2

Note 3.

Le 1^er juillet 2016, la Prestation fiscale canadienne pour enfants a été remplacée par l'Allocation canadienne pour enfants.

Retourner à la référence de note 3

Note 4.

Voir Statistique Canada 2016 dans la biographie.

Retourner à la référence de note 4

Note 5.

Loi sur l'immigration et la protection des réfugiés (L.C. 2001, ch. 27) http://laws-lois.justice.gc.ca/fra/lois/I-2.5/index.html.

Retourner à la référence de note 5

Note 6.

Définitions approuvées comme norme recommandée de Statistique Canada le 21 mars 2016.

Retourner à la référence de note 6

Note 7.

La majorité de cette section provient du rapport de méthodologie (Cascagnette, 2018).

Retourner à la référence de note 7

Note 8.

Pour de plus amples détails sur le traitement et la qualité des données du FFT1, consultez le site http://www23.statcan.gc.ca/imdb/p2SV_f.pl?Function=getSurvey&Id=240717.

Retourner à la référence de note 8

Note 9.

http://www.statcan.gc.ca/fra/microsimulation/demosim/demosim.

Retourner à la référence de note 9

Note 10.

Source : http://www.statcan.gc.ca/fra/reference/privee.

Retourner à la référence de note 10

Note 11.

http://www.statcan.gc.ca/fra/apercu/efrvp/bdli.

Retourner à la référence de note 11

Note 12.

Pour de plus amples détails sur la DAL, reportez-vous à la description figurant sur le site Web de Statistique Canada.

Retourner à la référence de note 12

Note 13.

Personnes ayant déménagé au sein du Canada après avoir atteint leur destination initiale au Canada.

Retourner à la référence de note 13

Note 14.

http://www23.statcan.gc.ca/imdb/p2SV_f.pl?Function=getSurvey&SDDS=2301.

Retourner à la référence de note 14

Date de modification :: 2019-07-11

Études analytiques : méthodes et références Base de données longitudinales sur l'immigration (BDIM) Rapport technique, 2016