Base de données longitudinales sur l’immigration (BDIM) Rapport technique, 2023
7 Évaluation des données et indicateurs de qualité
Passer au texte
Début du texte
7.1 Sources d’erreurs
Parce que la BDIM est produite à partir de plusieurs couplages d’enregistrements, elle comprend différentes sources d’erreurs, notamment des erreurs de couplage d’enregistrements, de mesure et de couverture. Nous expliquons, dans cette section, les sources d’erreurs et indiquerons l’importance de certaines d’entre elles.
Il convient de noter que, puisqu’il s’agit du recensement des immigrants déclarants admis depuis 1980, aucune pondération n’a été créée au sein de la BDIM. Aucune rectification n’est apportée aux années d’imposition manquantes ni aux erreurs de couplage, aucun échantillonnage n’a lieu et tous les déclarants couplés sont conservés dans l’ensemble de données final. Cependant, le couplage lui-même présente une forme d’erreur d’échantillonnage dans le cas d’échecs de couplage.
7.1.1 Erreurs de couplage d’enregistrements
Les ensembles de données produits à partir des résultats des couplages d’enregistrements peuvent comprendre des erreurs de couplage d’enregistrements. Deux types d’erreurs sont ainsi possibles : des faux positifs (fausses correspondances) et des faux négatifs (fausses non correspondances). Un couplage est un faux positif lorsque deux enregistrements ne concernant pas la même personne sont comptés comme une correspondance. Un couplage est un faux négatif lorsque deux enregistrements concernant la même personne sont comptés comme une non correspondance.
Il est possible de manquer une partie de l’historique d’un immigrant, puisque certains possèdent plusieurs numéros d’assurance sociale (NAS) au cours du temps (NAS temporaire attribué à l’admission au résident non permanent, puis NAS permanent attribué après l’admission). Ces deux NAS sont nécessaires pour constituer l’historique fiscal complet depuis l’admission de la personne au Canada. Le FCC et l’ECDS (décrit à la section 2.3) permettent de recenser ces deux NAS. Il est possible que, dans quelques cas, des liens entre les NAS échouent ou que des liens erronés soient créés.
7.1.2 Erreurs de mesure
Une erreur de mesure est la différence entre la valeur mesurée d’une variable et sa valeur réelle. On peut attribuer ce type d’erreur à plusieurs facteurs, notamment la saisie de données (p. ex. coquilles) et les erreurs des répondants (p. ex. mauvaise interprétation de la question posée). On a tenu compte de ce type d’erreur lors de la création du Fichier intégré des résidents permanents et non permanents (FRPN) pour éviter les renseignements contradictoires pour toute personne. Lorsqu’un enregistrement existe pour une personne dans le FIR et dans le FRN, par exemple, et que les variables sociodémographiques présentent des valeurs incohérentes, les valeurs à l’admission (celles du FIR) sont conservées. Voir les sections 7.2 et 7.5 qui fournissent certains chiffres.
7.1.3 Erreurs de couverture
Les erreurs de couverture proviennent d’omissions, de l’inclusion d’unités erronées, d’enregistrements en double et d’erreurs de classification d’enregistrements dans la base de données. Ces erreurs de couverture peuvent provenir d’une couverture inadéquate de la population. Elles peuvent se traduire par des estimations biaisées et les répercussions peuvent varier pour différents sous-groupes de la population. Ces erreurs entraînent souvent un sous-dénombrement. Le sous-dénombrement dans le cadre de la BDIM provient en partie de l’exclusion de la base de données des fichiers de données fiscales d’immigrants déclarants. Aucun enregistrement ne figure dans le fichier IMDB_T1FF pour les immigrants qui ne produisent pas de déclaration de revenus pour une année donnée ou qui le font en retard, même s’ils sont couplés aux données fiscales et font partie de la population d’intérêt. Si, pour une raison quelconque, l’enregistrement d’un immigrant n’est pas inclus dans le Fichier des immigrants reçus (FIR), il ne fera pas partie de la BDIM. Un surdénombrement survient lors de l’ajout à la base de données d’enregistrements exclus de la population cible. Un immigrant peut faire l’objet de plusieurs enregistrements dans le FIR du fait de plusieurs admissions non reconnues comme telles, par exemple. Veuillez-vous reporter à la section 7.4 et à l’annexe B pour de plus amples détails relatifs à la couverture de la BDIM.
7.2 Exactitude des données
Cette section porte sur l’exactitude des données relatives à l’immigration. Pour de plus amples détails sur l’exactitude du FFT1, veuillez-vous reporter au document sur le FFT1 (numéro d’enregistrement 4105).
L’exactitude de la BDIM dépend de la représentativité de la population qui y est incluse. Une étude menée au cours des premières années de la BDIM a conclu que cette dernière « semble être représentative de la population la plus susceptible de produire des déclarations de revenus. Par conséquent, les résultats obtenus à partir de la BDIM ne devraient pas être appliqués à la population immigrante dans son ensemble, mais plutôt à l’univers des immigrants qui produisent des déclarations de revenus » (Carpentier et Pinsonneault, 1994).
Les raisons expliquant les différences entre les déclarants et la population totale des personnes nées à l’étranger sont expliquées dans un article de Badets et Langlois (2000) décrivant les défis d’utilisation de la BDIM :
Les caractéristiques de la population immigrante qui produit des déclarations de revenus diffèrent de celles de l’ensemble de la population née à l’étranger, étant donné que la probabilité ou la nécessité de produire une déclaration de revenus varie selon l’âge, la situation familiale de la personne et d’autres facteurs. On pourrait s’attendre à ce qu’un pourcentage plus élevé d’immigrants de sexe masculin produisent une déclaration de revenus, notamment parce qu’ils ont des taux de participation au marché du travail plus élevés que les femmes. Le niveau de « saisie » des immigrants dans la BDIM est aussi influencé par les changements touchant l’impôt sur le revenu. Par exemple, la mise en place de programmes de crédits d’impôt non remboursables à l’échelle fédérale et provinciale incite les personnes qui n’ont pas de revenus imposables à produire une déclaration de revenus pour être admissibles à certains crédits d’impôt.
Ces commentaires sur la représentativité de la BDIM s’appliquent toujours.
7.2.1 BDIM de 2023: Taux de couplage
Cette section porte sur la BDIM de 2023. Le taux global de couplage entre les données d'immigration d'IRCC et le Dépôt d’enregistrements dérivés de l’ECDS était de 97,5 % (voir section 4). Un lien ne signifie pas nécessairement qu'une déclaration fiscale est disponible puisqu'il est possible de coupler les personnes à charge des déclarants ou des immigrants qui n'ont pas encore produit leur déclaration de revenus. Ce taux de couplage théorique informe principalement sur la façon dont les fichiers d’IRCC pourraient être associés dans un environnement référentiel plus large.
Parmi les immigrants admis entre 1980 et 2023, 85,7 % étaient liés à au moins un FFT1. Ce taux représente la couverture effective du couplage entre les déclarations fiscales et les fichiers d'immigration. Tel que présenté dans les statistiques suivantes, ce taux de couverture peut varier selon le sexe et l'âge.
La proportion de déclarants couplés selon le groupe d'âge au moment de l'admission et le sexe est indiquée au tableau 4. On s'attend à ce que les taux plus faibles pour le groupe d'âge de 0 à 14 ans soient observés puisque les personnes de ce groupe d'âge ne sont pas en âge de travailler. Voir l'annexe B pour les taux selon le sexe, le groupe d'âge et la cohorte d'admission.
| Âge à l’admission | |||||||
|---|---|---|---|---|---|---|---|
| 0 à 14 ans | 15 à 24 ans | 25 à 34 ans | 35 à 49 ans | 50 à 64 ans | 65 ans et plus | Total | |
| pourcentage | |||||||
| Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2023. | |||||||
| Hommes | 57,9 | 90,3 | 92,0 | 91,7 | 87,8 | 74,8 | 83,6 |
| Femmes | 57,0 | 89,5 | 91,5 | 92,2 | 85,9 | 73,6 | 83,6 |
| Total | 57,5 | 89,9 | 91,7 | 91,9 | 86,8 | 74,1 | 83,6 |
À mesure que les immigrants vieillissent, ils commencent à produire des déclarations de revenus et sont inclus dans la BDIM. Le graphique 1 montre que, parmi les immigrants admis à tout âge de 0 à 14 ans, la proportion de déclarants couplés est supérieure pour les immigrants admis avant 2000 que pour ceux admis depuis 2000. Les immigrants récents ont des taux de couplage inférieurs. Voir l’annexe B pour un tableau présentant la proportion de déclarants couplés par groupe d’âge à l’admission, sexe et décennie d’admission.

Tableau de données du graphique 1
| Cohorts | Tranche d'âge | |||||
|---|---|---|---|---|---|---|
| 0 à 14 ans | 15 à 24 ans | 25 à 34 ans | 35 à 49 ans | 50 à 64 ans | 65 ans et plus | |
| proportion | ||||||
| Source: Statistics Canada, 2023 Longitudinal Immigration Database. | ||||||
| Cohortes de 1980 à 1989 | 0,82 | 0,93 | 0,94 | 0,93 | 0,83 | 0,61 |
| Cohortes de 1990 à 1999 | 0,81 | 0,92 | 0,93 | 0,93 | 0,89 | 0,76 |
| Cohortes de 2000 à 2009 | 0,78 | 0,93 | 0,92 | 0,93 | 0,93 | 0,88 |
| Cohortes de 2010 à 2019 | 0,32 | 0,95 | 0,96 | 0,95 | 0,92 | 0,86 |
| Cohortes de 2020 à 2022 | 0,01 | 0,81 | 0,92 | 0,93 | 0,82 | 0,69 |
Le graphique 2 illustre la proportion de déclarants ainsi que le nombre de déclarants et de non-déclarants par année d’admission; la mention « non déclarant » indique qu’aucun enregistrement dans le FFT1 n’est disponible. Dans la BDIM de 2023, le taux de déclaration varie en fonction de l’année d’admission, de 67,7 % pour les personnes admises en 2022 à 91,3 % pour celles admises en 1989. Le taux de déclaration augmente à mesure du nombre d’années de présence des immigrants au Canada; cela peut expliquer pourquoi les taux de couplage sont supérieurs pour les immigrants admis dans les années 1990 et le début des années 2000. Voir l’annexe B, tableaux 14 et 15, pour connaître des chiffres de répartition détaillés par année d’admission.

Tableau de données du graphique 2
| Année d'admission | Déclarants | Non-déclarants | Taux |
|---|---|---|---|
| nombre d'immigrants | pourcentage | ||
| Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2023. | |||
| 1980 | 120 380 | 22 620 | 84,2 |
| 1981 | 107 660 | 20 810 | 83,8 |
| 1982 | 103 360 | 17 600 | 85,4 |
| 1983 | 77 080 | 11 880 | 86,6 |
| 1984 | 77 430 | 10 520 | 88,0 |
| 1985 | 75 010 | 8 870 | 89,4 |
| 1986 | 89 030 | 9 650 | 90,2 |
| 1987 | 137 510 | 13 490 | 91,1 |
| 1988 | 146 170 | 14 340 | 91,1 |
| 1989 | 173 760 | 16 630 | 91,3 |
| 1990 | 192 060 | 23 010 | 89,3 |
| 1991 | 208 460 | 22 970 | 90,1 |
| 1992 | 228 580 | 24 940 | 90,2 |
| 1993 | 230 570 | 24 570 | 90,4 |
| 1994 | 198 430 | 24 530 | 89,0 |
| 1995 | 188 490 | 23 070 | 89,1 |
| 1996 | 198 230 | 26 350 | 88,3 |
| 1997 | 189 050 | 25 600 | 88,1 |
| 1998 | 155 270 | 17 900 | 89,7 |
| 1999 | 168 770 | 20 070 | 89,4 |
| 2000 | 203 580 | 22 510 | 90,0 |
| 2001 | 224 810 | 24 110 | 90,3 |
| 2002 | 204 730 | 22 600 | 90,1 |
| 2003 | 197 950 | 21 690 | 90,1 |
| 2004 | 212 500 | 22 920 | 90,3 |
| 2005 | 235 020 | 26 780 | 89,8 |
| 2006 | 225 180 | 26 050 | 89,6 |
| 2007 | 210 770 | 25 640 | 89,2 |
| 2008 | 217 220 | 29 560 | 88,0 |
| 2009 | 221 580 | 30 250 | 88,0 |
| 2010 | 241 450 | 38 810 | 86,2 |
| 2011 | 211 230 | 36 900 | 85,1 |
| 2012 | 218 590 | 38 440 | 85,0 |
| 2013 | 218 240 | 40 190 | 84,4 |
| 2014 | 220 310 | 39 550 | 84,8 |
| 2015 | 226 180 | 45 140 | 83,4 |
| 2016 | 236 040 | 59 610 | 79,8 |
| 2017 | 234 030 | 51 740 | 81,9 |
| 2018 | 252 920 | 67 240 | 79,0 |
| 2019 | 261 890 | 78 340 | 77,0 |
| 2020 | 144 360 | 39 560 | 78,5 |
| 2021 | 327 470 | 77 360 | 80,9 |
| 2022 | 295 580 | 140 830 | 67,7 |
7.2.2 Disponibilité de la date de décès
L’année et le mois d’un décès, ainsi que l’indicateur de décès, sont inclus dans le FRPN. Dans la BDIM de 2021, ces variables ont été couplées à l'aide de la Base canadienne de données sur la mortalité (BCDM). Dans le passé, ces variables étaient fondées sur la Base de mortalité amalgamée (BMA) de Statistique Canada, qui est un ensemble de données archivé qui combine des enregistrements entre la BCDM, les statistiques de l'état civil, et des fichiers fiscaux. La BCDM est une base de données administratives qui recueille des renseignements sur les dates et les causes de décès dans tous les registres provinciaux et territoriaux de l'état civil au Canada. Un certain sous-dénombrement, bien que minime, existe dans la base de données, car il ne comprend pas les décès de Canadiens (1) qui sont morts à l'extérieur du Canada, à l'exception des États-Unis ; (2) qui ont servi comme membres des Forces canadiennes, ou (3) dont les corps n'ont pas été identifiés. Il est à noter que la BCDM ne comprend pas les décès qui ont été déclarés dans les dossiers fiscaux.
Le graphique 3 décrit la tendance générale du nombre de décès par an depuis 1974 pour les immigrants arrivés depuis 1952. Les données antérieures à 1980 ont été ajoutées récemment à la BDIM. La valeur « 9999 » représente les enregistrements d’immigrants décédés pour lesquels l’année de décès n’est pas disponible.

Tableau de données du graphique 3
| Année de décès | Résidents permanents entre 1952 et 1979 | Résidents permanents depuis 1980 |
|---|---|---|
| nombre de décès | ||
Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2023. |
||
| 1974 | 4 840 | . indisponible pour toute période de référence |
| 1975 | 5 270 | . indisponible pour toute période de référence |
| 1976 | 5 590 | . indisponible pour toute période de référence |
| 1977 | 6 220 | . indisponible pour toute période de référence |
| 1978 | 6 530 | . indisponible pour toute période de référence |
| 1979 | 7 090 | . indisponible pour toute période de référence |
| 1980 | 7 700 | 90 |
| 1981 | 7 610 | 300 |
| 1982 | 7 950 | 510 |
| 1983 | 8 530 | 740 |
| 1984 | 8 950 | 950 |
| 1985 | 9 370 | 1 110 |
| 1986 | 10 090 | 1 340 |
| 1987 | 10 470 | 1 630 |
| 1988 | 11 100 | 1 900 |
| 1989 | 11 550 | 2 210 |
| 1990 | 11 850 | 2 450 |
| 1991 | 12 660 | 2 910 |
| 1992 | 13 230 | 3 210 |
| 1993 | 14 000 | 3 750 |
| 1994 | 14 510 | 4 280 |
| 1995 | 15 310 | 4 730 |
| 1996 | 15 720 | 5 130 |
| 1997 | 16 180 | 5 450 |
| 1998 | 16 750 | 5 770 |
| 1999 | 17 540 | 6 190 |
| 2000 | 17 560 | 6 400 |
| 2001 | 18 020 | 6 940 |
| 2002 | 18 710 | 7 320 |
| 2003 | 19 200 | 8 100 |
| 2004 | 19 430 | 8 280 |
| 2005 | 20 160 | 8 660 |
| 2006 | 20 390 | 9 140 |
| 2007 | 21 360 | 9 860 |
| 2008 | 21 850 | 10 280 |
| 2009 | 22 360 | 10 770 |
| 2010 | 22 720 | 11 130 |
| 2011 | 23 010 | 11 920 |
| 2012 | 23 540 | 12 180 |
| 2013 | 24 830 | 13 200 |
| 2014 | 25 410 | 14 110 |
| 2015 | 26 290 | 15 010 |
| 2016 | 26 910 | 15 860 |
| 2017 | 27 740 | 17 210 |
| 2018 | 28 030 | 18 120 |
| 2019 | 28 180 | 19 020 |
| 2020 | 31 370 | 23 340 |
| 2021 | 30 760 | 24 650 |
| 2022 | 32 280 | 23 420 |
| 9999 | 30 | 640 |
7.2.3 Déclarants avant l’admission par rapport aux enregistrements du Fichier des résidents non permanents (FRN)
Les résultats inclus dans cette section sont tirés d’une étude fondée sur la BDIM de 2014. Les déclarants avant l’admission sont des immigrants qui ont produit une déclaration de revenus avant leur année d’admission. Il est parfois déduit que tous les déclarants avant l’admission sont des immigrants qui étaient des résidents non permanents avant leur admission. Cette section explique pourquoi ce n’est pas le cas. Au total, 1,26 million de personnes ont produit une déclaration de revenus avant leur admission officielle depuis 1980; sur ce total, 212 500 ne sont pas couplées à un enregistrement de résident non permanent, contrairement à ce à quoi l’on pourrait s’attendre. Après une enquête approfondie, on a découvert que la plupart des déclarants avant l’admission qui étaient des résidents permanents non couplés à un enregistrement de résident non permanent étaient probablement des immigrants ayant produit une déclaration de revenus lorsque cela n’était pas requis : 96 % de ces déclarants avant l’admission ont uniquement produit une déclaration de revenus pour l’année précédant leur année d’admission et 75 % n’ont déclaré aucun revenu (96 % n’avaient aucun salaire). Comme le montre le graphique 4, la plupart de ces déclarants avant l’admission ont été admis au cours des premiers mois de l’année, avant la date d’échéance de la production d’une déclaration de revenus pour l’année précédente. Il semble que certains immigrants admis avant le mois de mai ont produit une déclaration de revenus pour l’année précédant leur année d’admission; ce qu’ils n’étaient pas tenus de faire.
Selon ces résultats, il est justifié de supprimer les enregistrements présentant les variables de déclarant avant l’admission Prefiler_ind=1 et FIRST_EFFECTIVE_YEAR=. des études sur les immigrants ayant une expérience avant leur admission dépend de l’analyse, puisque FIRST_EFFECTIVE_YEAR=. signifie qu’aucun enregistrement ne figure dans le fichier de permis de résidents non permanents.

Tableau de données du graphique 4
| Mois d'admission | nombre d'immigrants |
|---|---|
| Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2014. | |
| janvier | 32 300 |
| février | 36 100 |
| mars | 35 500 |
| avril | 24 100 |
| mai | 20 500 |
| juin | 18 200 |
| juillet | 16 100 |
| août | 11 200 |
| septembre | 9 800 |
| octobre | 5 500 |
| novembre | 2 000 |
| décembre | 1 200 |
Tous les immigrants ayant une expérience avant leur admission ne sont pas considérés comme étant des déclarants avant l’admission : 478 100 immigrants disposent d’enregistrements de résidents non permanents avec la variable Prefiler_ind=0. En fonction du sujet étudié, utiliser la variable FIRST_EFFECTIVE_YEAR<>. ou le nombre de permis de résidence temporaire (variable NUMBER_ALL_PERMITS) est plus approprié pour étudier les immigrants ayant une expérience avant leur admission. La variable Prefiler_ind=0 indique qu’aucune déclaration de revenus n’a été produite avant l’admission, mais elle ne signifie pas que la personne n’a pas d’expérience au Canada avant son admission.
7.2.4 Indicateur de conjoint
La BDIM contient des variables permettant aux utilisateurs de données d’obtenir des renseignements sur l’état matrimonial et les conjoints. La section suivante présente les résultats d’une étude menée sur la BDIM de 2012. Aucune modification majeure n’a été apportée depuis aux codes d’état matrimonial ni à l’indicateur relatif à la famille.
L’identificateur de conjoint (SP__IDI) est dérivé des fichiers de données fiscales. Ce renseignement peut uniquement être dérivé lorsque le répondant déclare son conjoint ou sa conjointe lors de sa déclaration de revenus; cela entraîne une sous-estimation des couples par rapport à l’état matrimonial déclaré dans les fichiers de données fiscales. Il est également possible à partir du FFT1 d’obtenir l’état matrimonial au moment de la déclaration.
Avant 1991, la catégorie « célibataire » n’était pas proposée comme état matrimonial (MSTCO). La catégorie « conjoint de fait » est disponible depuis 1992 pour tous les ensembles de données (1982 à 2012). Depuis 1992, la proportion des enregistrements de la BDIM indiquant un état matrimonial « célibataire » varie entre 20 % et 30 %. La proportion de personnes « séparées » a diminué, passant de 30 % avant 1992 à 4 % par la suite. Des modifications de tendance n’ont pas influé sur les autres catégories d’état matrimonial.
Une analyse portant sur la répartition de l’état matrimonial (MSTCO des fichiers de données fiscales) et l’identificateur de conjoint (SP__IDI) a révélé des différences entre ces deux variables. Ces différences sont dues à l’absence de valeurs d’état matrimonial dans certains enregistrements. Dans une situation parfaite, les enregistrements de toutes les personnes mariées présenteraient des renseignements sur le conjoint et ceux de toutes les personnes célibataires n’en indiqueraient pas. L’analyse effectuée a indiqué que la qualité des données s’était améliorée après 1992, lorsque les états matrimoniaux distincts « conjoint de fait » et « célibataire » ont été introduits.
Lacunes d’indication de conjoint
À la suite d’un examen de l’historique longitudinal des immigrants sur la BDIM de 2012, on a relevé des cas où le conjoint ou conjoint de fait manquait (ou différait) pour une année donnée et où le même conjoint était déclaré deux ou trois ans plus tard. Le graphique 5 fournit un résumé de ces lacunes.

Tableau de données du graphique 5
| Tax year | Pourcentage |
|---|---|
| Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2012. | |
| 1980 | 16,8 |
| 1981 | 16,6 |
| 1982 | 17,1 |
| 1983 | 17,7 |
| 1984 | 17,4 |
| 1985 | 17,7 |
| 1986 | 17,7 |
| 1987 | 16,9 |
| 1988 | 14,4 |
| 1989 | 13,9 |
| 1990 | 13,4 |
| 1991 | 14,4 |
| 1992 | 13,5 |
| 1993 | 12,7 |
| 1994 | 9,8 |
| 1995 | 9,4 |
| 1996 | 8,7 |
| 1997 | 8,1 |
| 1998 | 7,8 |
| 1999 | 7,1 |
| 2000 | 6,3 |
| 2001 | 5,6 |
| 2002 | 5,0 |
| 2003 | 4,6 |
| 2004 | 4,0 |
| 2005 | 3,1 |
| 2006 | 2,9 |
| 2007 | 2,4 |
| 2008 | 1,8 |
| 2009 | 1,1 |
| 2010 | 0,7 |
| 2011 | 0,5 |
La plupart des immigrants du fichier ont un conjoint ou non entre 1980 et 2012 selon les fichiers IMDB_T1FF. Il faut souligner qu’aucun état matrimonial (et aucun renseignement sur le conjoint) n’est disponible pour 1,2 million d’immigrants sur environ 6 millions d’immigrants.
7.3 Variables imputées
7.3.1 Imputation des variables relatives à la scolarité
Un problème de qualité des données a en outre été relevé quant aux variables relatives au niveau de scolarité et aux années d’études. Une proportion non négligeable de personnes n’ayant pas déclaré leur niveau de scolarité ou d’années d’études ont reçu le code « 0 » soit « aucun » plutôt que « manquant » pour les variables EDUCATION_QUALIFICATIONS et YEARS_OF_SCHOOLING. Ce problème est devenu courant de 2011 à 2014. En 2011, 35 % des immigrants ont indiqué ne pas avoir suivi d’études, par rapport à environ 10 % dans les années 1990.
Ce problème a été résolu en imputant des variables de scolarité à partir des moyennes des valeurs des variables de scolarité de 2008 à 2010, pour refléter les variables de scolarité de l’année la plus récente. Pour cette imputation, on a utilisé des variables telles que l’âge à l’admission, le groupement de catégories d’immigration 2, la profession envisagée, le sexe et le pays de dernière résidence. La méthodologie d’imputation du plus proche voisin a été employée. La variable d’imputation de la scolarité Education_imputation_ind (0: non; 1: oui), disponible dans le FRPN, a été créée pour déterminer les enregistrements au sein desquels les variables de scolarité ont été imputées.
Pour les immigrants admis en 2016, le nombre de cas où une scolarité non-déclarée a reçu le code « 0 » ou « aucun » plutôt que « manquant » a été réduit. Cependant, un nombre non négligeable d’enregistrements avait un niveau de scolarité manquant avec des années d’études valides. Pour ces enregistrements, les années d’études ont été utilisées pour imputer une valeur pour le niveau de scolarité.
Pour les demandeurs principaux admis depuis 2015, sous le processus d’entrée express, les années de scolarisation sont sous-estimées.
Pour la BDIM 2023, les personnes admises entre 2015 et 2023 qui ont été connectées au dossier Express Entry ont vu leur éducation imputée en utilisant les valeurs trouvées dans le fichier Express Entry. Une variable d’éducation plus complète, Education_Derived, a été créée, combinant les données de Educatoin_Qualification pour ceux qui n’ont pas été trouvés dans le fichier Express Entry, et les nouvelle valeurs provenant de Express Entry.
Les utilisateurs devraient noter que les valeurs du fichier d’Express Entry sont basées sur l’évaluation par l’agent d’immigration des qualifications scolaires du demandeur dans le contexte d’une équivalence canadienne, alors que les valeurs de Education_Qualification sont auto-déclarées par le demandeur et ne reflète pas nécessairement l’équivalence canadienne.
Education_Derived a été imputée à ‘manquant’ pour les personnes admises en 2024 ou plus tard.
7.3.2 Imputation des variables relatives à la langue
Deux variables linguistiques ont été ajoutées à la BDIM, English_IND et French_IND, indiquant la première langue officielle connue à l’admission. Pour ceux qui ont été admis en 2018 ou avant, ils sont définis comme des résidents permanents ayant français (anglais) comme langue maternelle ou ayant une langue maternelle autre que l’anglais ou le français et déclarant le français seulement (anglais seulement) comme la langue officielle connue à l’admission.
Pour les personnes admises en 2019 ou plus tard, elles sont définies comme des résidents permanents ayant déclaré français seulement (anglais seulement) comme langue officielle à l’admission ou ayant déclaré l’anglais et le français comme leur connaissance de la langue officielle à l’admission et déclarant le français (l’anglais) comme la langue dans laquelle ils sont le plus à l’aise.
7.4 Couverture
7.4.1 Couverture du Fichier intégré des résidents permanents et non permanents (FRPN)
Le Fichier intégré des résidents permanents et non permanents (FRPN) de 2023 contient plus de 9,6 millions d’enregistrements (tableau 5); parmi ceux-ci, plus de 8,3 millions (85,7 %) sont couplés à au moins un fichier de données fiscales. Il faut noter que les données sur l’immigration des non-déclarants et les déclarants sont incluses dans un fichier intitulé PNRF_ 1980_2023. Le tableau suivant présente la répartition des enregistrements en fonction de leur présence dans les différents fichiers d’immigration et de données fiscales. Environ 2,5 million d’enregistrements portent sur des immigrants qui étaient des résidents temporaires avant de devenir résidents permanents; plus de 2,4 million de ces enregistrements sont couplés à au moins un fichier de données fiscales. Voir l’annexe B pour des chiffres de répartition détaillés par année d’admission.
| Résidents permanents | Résidents permanents ayant un permis de résidence non permanente | Nombre de déclarants | |
|---|---|---|---|
| nombre | |||
| Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2023. | |||
| Total des déclarants | 5 850 820 | 2 456 110 | 8 306 940 |
| Total des non déclarants | 1 244 600 | 140 590 | 1 385 190 |
| Total | 7 095 430 | 2 596 700 | 9 692 130 |
| pourcentage | |||
| Pourcentage de déclarants | 82,5 | 94,6 | 85,7 |
Les données relatives aux immigrants possédant des permis de résidence non permanente sont disponibles. La proportion d’immigrants ayant une expérience avant l’admission varie en fonction de l’année d’admission (graphique 6); elle va de 3,8 % en 1980 à 69,3 % en 2023. Par conséquent, la proportion d’immigrants ayant une expérience avant l’admission au début des années 1980 est sous-représentée. La proportion des immigrants déclarants possédant une expérience avant leur admission (ligne pleine) est supérieure à la proportion globale des immigrants possédant une expérience avant leur admission (ligne pointillée), car le taux de couplage de ces immigrants est supérieur à celui des immigrants sans expérience avant leur admission.

Tableau de données du graphique 6
| Année d'admission | Tous les immigrants | Déclarants | Non-déclarants |
|---|---|---|---|
| pourcentage | |||
| Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2023. | |||
| 1980 | 3,8 | 4,0 | 2,5 |
| 1981 | 11,3 | 12,4 | 5,6 |
| 1982 | 14,2 | 15,5 | 6,7 |
| 1983 | 17,3 | 18,8 | 7,6 |
| 1984 | 19,8 | 21,3 | 8,8 |
| 1985 | 20,0 | 21,3 | 8,6 |
| 1986 | 24,7 | 26,3 | 9,7 |
| 1987 | 23,4 | 24,8 | 8,5 |
| 1988 | 11,5 | 12,0 | 6,0 |
| 1989 | 13,6 | 14,3 | 6,9 |
| 1990 | 16,5 | 17,6 | 7,8 |
| 1991 | 32,0 | 34,2 | 12,6 |
| 1992 | 34,7 | 36,9 | 14,6 |
| 1993 | 26,8 | 28,4 | 12,1 |
| 1994 | 18,1 | 19,4 | 7,5 |
| 1995 | 19,9 | 21,4 | 7,4 |
| 1996 | 19,6 | 21,3 | 6,5 |
| 1997 | 17,4 | 19,0 | 5,7 |
| 1998 | 19,3 | 20,7 | 6,9 |
| 1999 | 19,0 | 20,5 | 6,6 |
| 2000 | 18,2 | 19,6 | 6,0 |
| 2001 | 16,3 | 17,4 | 5,7 |
| 2002 | 15,1 | 16,3 | 4,8 |
| 2003 | 15,7 | 17,0 | 4,6 |
| 2004 | 19,2 | 20,7 | 5,3 |
| 2005 | 20,0 | 21,7 | 5,2 |
| 2006 | 22,7 | 24,7 | 5,3 |
| 2007 | 23,3 | 25,5 | 5,0 |
| 2008 | 23,2 | 25,7 | 4,7 |
| 2009 | 24,1 | 26,7 | 5,1 |
| 2010 | 22,9 | 25,9 | 4,4 |
| 2011 | 23,6 | 26,8 | 5,1 |
| 2012 | 25,4 | 29,0 | 5,0 |
| 2013 | 26,9 | 30,8 | 5,4 |
| 2014 | 34,1 | 39,1 | 6,4 |
| 2015 | 33,2 | 38,6 | 6,3 |
| 2016 | 30,0 | 36,2 | 5,7 |
| 2017 | 38,0 | 44,6 | 8,2 |
| 2018 | 37,4 | 44,6 | 10,3 |
| 2019 | 37,0 | 44,8 | 11,0 |
| 2020 | 47,4 | 55,3 | 18,8 |
| 2021 | 69,3 | 76,6 | 38,3 |
| 2022 | 41,6 | 53,3 | 17,1 |
7.4.1.2 Couverture des résidents non permanents
Cette section décrit la couverture des individus qui ont seulement des permis de résidence non permanente depuis 1980, les données fiscales sont disponibles pour 31,5 % de ces personnes. Parmi les individus qui ne sont pas devenus des résidents permanents, les titulaires d'un permis de travail ont le plus haut taux de couverture, des données fiscales sont disponibles pour 40,3 % de cette population (voir le tableau 6). Il y a une grande variété de permis de résidence non permanente. Certains sont d’une durée aussi courte qu’un jour.
| Avec permis de travail | Avec permis d'étude | Demande d'asile | Total | |
|---|---|---|---|---|
| nombre | ||||
| Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2023. | ||||
| Total déclarants | 1 953 280 | 979 150 | 229 780 | 2 269 540 |
| Total non déclarants | 2 888 540 | 2 106 160 | 383 510 | 4 939 010 |
| Total | 4 841 820 | 3 085 310 | 613 290 | 7 208 550 |
| pourcentage | ||||
| pourcentage de déclarants | 40,3 | 31,7 | 37,5 | 31,5 |
7.4.2 Taille du Fichier sur la famille T1 et couverture par année
Les fichiers de données fiscales sont disponibles à partir de 1982 pour les résidents permanents couplés. Certains résidents permanents étaient des résidents non permanents avant leur admission. Le tableau 7 fournit des détails sur la répartition des résidents permanents couplés, avec ou sans permis de résidence non permanente avant leur admission, par année d’imposition. Au moins un fichier de données fiscales est disponible pour 82,5 % de résidents permanents sans permis de résidence non permanente avant leur admission et pour 94,6 % de résidents permanents qui étaient résidents non permanents avant leur admission. Le fait que les résidents permanents possédant des permis temporaires avant leur admission présentent un taux plus élevé de déclarations de revenus que les résidents permanents sans permis avant leur admission peut s’expliquer par une exigence relative au processus de demande de résidence permanente pour les résidents non permanents.
Les résidents non permanents qui demandent la résidence permanente doivent en effet respecter l’obligation de déclaration de revenus au Canada. Le nombre de déclarants dans le fichier IMDB_T1FF augmente à mesure des années, puisque la taille de la population dans le champ d’enquête augmente.
| Année | Résidents permanents admis avant 1980 | Résidents permanents depuis 1980 | Résidents permanents ayant un permis non-permanent | Résidents non-permanents uniquement | Nombre de déclarants |
|---|---|---|---|---|---|
| nombre | |||||
Source : Statistique Canada, Base de données longitudinales sur l'immigration 2023. |
|||||
| 1982 | 1 645 780 | 190 480 | 56 430 | 25 510 | 1 912 530 |
| 1983 | 1 627 060 | 226 270 | 66 380 | 23 670 | 1 937 690 |
| 1984 | 1 622 790 | 265 520 | 80 890 | 24 070 | 1 987 320 |
| 1985 | 1 603 960 | 299 800 | 96 050 | 22 770 | 2 016 370 |
| 1986 | 1 659 710 | 357 980 | 126 210 | 26 810 | 2 163 640 |
| 1987 | 1 639 830 | 417 590 | 159 720 | 27 010 | 2 236 500 |
| 1988 | 1 660 280 | 509 970 | 201 670 | 36 060 | 2 399 300 |
| 1989 | 1 687 610 | 623 920 | 265 180 | 48 390 | 2 615 450 |
| 1990 | 1 696 680 | 745 320 | 312 680 | 51 740 | 2 795 930 |
| 1991 | 1 693 850 | 842 950 | 361 420 | 51 500 | 2 938 760 |
| 1992 | 1 700 290 | 949 090 | 405 350 | 51 050 | 3 094 360 |
| 1993 | 1 732 760 | 1 093 230 | 444 760 | 51 010 | 3 309 580 |
| 1994 | 1 717 460 | 1 214 590 | 470 230 | 50 170 | 3 440 080 |
| 1995 | 1 701 320 | 1 326 720 | 495 570 | 52 500 | 3 563 620 |
| 1996 | 1 682 370 | 1 434 240 | 516 490 | 54 380 | 3 674 950 |
| 1997 | 1 657 840 | 1 548 650 | 537 080 | 56 380 | 3 787 500 |
| 1998 | 1 633 800 | 1 648 530 | 557 300 | 55 300 | 3 882 500 |
| 1999 | 1 627 420 | 1 772 950 | 593 250 | 59 920 | 4 041 120 |
| 2000 | 1 609 650 | 1 916 580 | 633 910 | 67 780 | 4 215 600 |
| 2001 | 1 596 230 | 2 073 510 | 683 220 | 77 760 | 4 418 370 |
| 2002 | 1 566 200 | 2 203 480 | 721 040 | 83 420 | 4 561 920 |
| 2003 | 1 546 200 | 2 325 670 | 758 400 | 86 690 | 4 704 830 |
| 2004 | 1 530 160 | 2 456 610 | 800 550 | 89 240 | 4 864 500 |
| 2005 | 1 504 970 | 2 572 530 | 834 490 | 95 940 | 4 996 040 |
| 2006 | 1 487 250 | 2 721 690 | 892 040 | 100 380 | 5 189 530 |
| 2007 | 1 468 380 | 2 845 070 | 961 370 | 113 150 | 5 376 270 |
| 2008 | 1 448 110 | 2 969 850 | 1 040 450 | 135 770 | 5 582 620 |
| 2009 | 1 427 680 | 3 085 060 | 1 108 540 | 144 990 | 5 754 820 |
| 2010 | 1 402 860 | 3 210 730 | 1 167 500 | 152 860 | 5 922 630 |
| 2011 | 1 383 820 | 3 341 160 | 1 235 990 | 159 860 | 6 109 610 |
| 2012 | 1 357 120 | 3 459 270 | 1 309 170 | 169 220 | 6 283 720 |
| 2013 | 1 338 680 | 3 592 180 | 1 392 590 | 183 820 | 6 496 340 |
| 2014 | 1 316 980 | 3 711 570 | 1 485 520 | 191 870 | 6 695 160 |
| 2015 | 1 289 570 | 3 838 940 | 1 565 250 | 190 850 | 6 874 090 |
| 2016 | 1 261 330 | 3 961 000 | 1 659 020 | 198 650 | 7 069 640 |
| 2017 | 1 235 360 | 4 065 020 | 1 789 770 | 236 740 | 7 316 750 |
| 2018 | 1 212 000 | 4 206 620 | 1 951 600 | 304 340 | 7 664 630 |
| 2019 | 1 173 050 | 4 343 280 | 2 096 420 | 426 620 | 8 029 700 |
| 2020 | 1 150 500 | 4 412 810 | 2 146 050 | 463 720 | 8 163 570 |
| 2021 | 1 119 920 | 4 500 150 | 2 181 670 | 667 640 | 8 460 090 |
| 2022 | 1 090 390 | 4 664 710 | 2 211 500 | 1 148 640 | 9 106 130 |
| Total des déclarants | 2 065 390 | 5 850 820 | 2 456 110 | 2 256 120 | ... n'ayant pas lieu de figurer |
| Total des non‑déclarants | 2 049 250 | 1 244 600 | 140 590 | 3 867 490 | ... n'ayant pas lieu de figurer |
| pourcentage | |||||
| Pourcentage de déclarants | 50,2 | 82,5 | 94,6 | 36,8 | ... n'ayant pas lieu de figurer |
Le graphique 7 montre que la proportion des résidents permanents qui étaient résidents non permanents avant leur admission, par année, varie de 22,7 %, le plus bas niveau pour l’année d’imposition 1983, à 32,7 %, niveau le plus élevé correspondant à l’année d’imposition de 2020.

Tableau de données du graphique 7
| Année d'imposition | pourcentage |
|---|---|
| Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2023. | |
| 1982 | 22,9 |
| 1983 | 22,7 |
| 1984 | 23,4 |
| 1985 | 24,3 |
| 1986 | 26,1 |
| 1987 | 27,7 |
| 1988 | 28,3 |
| 1989 | 29,8 |
| 1990 | 29,6 |
| 1991 | 30,0 |
| 1992 | 29,9 |
| 1993 | 28,9 |
| 1994 | 27,9 |
| 1995 | 27,2 |
| 1996 | 26,5 |
| 1997 | 25,8 |
| 1998 | 25,3 |
| 1999 | 25,1 |
| 2000 | 24,9 |
| 2001 | 24,8 |
| 2002 | 24,7 |
| 2003 | 24,6 |
| 2004 | 24,6 |
| 2005 | 24,5 |
| 2006 | 24,7 |
| 2007 | 25,3 |
| 2008 | 25,9 |
| 2009 | 26,4 |
| 2010 | 26,7 |
| 2011 | 27,0 |
| 2012 | 27,5 |
| 2013 | 27,9 |
| 2014 | 28,6 |
| 2015 | 29,0 |
| 2016 | 29,5 |
| 2017 | 30,6 |
| 2018 | 31,7 |
| 2019 | 32,6 |
| 2020 | 32,7 |
| 2021 | 32,7 |
| 2022 | 32,2 |
Un immigrant qui produit une déclaration de revenus pour une année donnée n’en produira pas nécessairement l’année suivante. Si une personne A, par exemple, a été admise en 1983, elle peut figurer dans les fichiers de données fiscales de 1984 à 1999, mais pas dans le fichier de 2000, et y figurer ensuite à nouveau de 2001 à 2013. Ainsi, des fichiers de données fiscales étaient disponibles tous les ans pour 24,3 % des déclarants de la cohorte de 1980. Une émigration externe, un décès ou un retard de déclaration peut expliquer, en outre, que des immigrants déclarants aient pu ne plus produire de déclaration de revenus ou ne pas en produire certaines années.
La plupart des immigrants déclarent leurs revenus pour la première fois l’année de leur admission ou l’année précédente ou suivante. Ainsi, sur les 251 230 immigrants admis en 2006, 100 530 (40,0 %) ont produit une déclaration de revenus pour la première fois en 2006, alors que 15 560 (6,2 %) l’ont fait en 2007 et 3 190 (1,3 %) en 2015.
7.5 Évaluation de la qualité de la données sur l’immigration
7.5.1 Évaluation de la qualité du Fichier intégré des résidents permanents et non permanents (FRPN)
Le contenu du FRPN (PNRF_1980_2023) a été évalué. Alors que la collecte des données fiscales et relatives à l’admission est obligatoire pour les personnes dans le champ d’enquête, ces dernières peuvent ne pas remplir tous les champs. Ces champs ont pu être laissés vides parce que le répondant ne connaissait pas la réponse ou pour d’autres raisons, que les utilisateurs des données ne peuvent connaître (p. ex. refus) (McLeish, 2011). L’absence de réponse à certaines questions peut présenter des problèmes lorsque la BDIM est utilisée à des fins statistiques, notamment dans les cas suivants :
- Si l’utilisateur de la base de données souhaite produire un échantillon fondé sur les caractéristiques pour lesquelles des enregistrements manquent, une erreur de couverture peut survenir (c.-à-d. les personnes incluses dans la base d’échantillon peuvent ne pas être représentatives de la population cible).
- S’il s’agit d’une absence de données informatives (p. ex. l’absence du renseignement n’est pas un cas aléatoire; l’absence de réponse indique ce que la réponse aurait été), toute analyse utilisant ces variables serait biaisée.
On a évalué la présence de variables manquantes et de valeurs non valides. Les chiffres présentés dans cette section sont arrondis. Les valeurs non valides sont soit incohérentes soit elles ne figurent pas dans les tableaux de métadonnées à la disposition des utilisateurs (voir la composante sur l’immigration du dictionnaire de données en annexe). La plupart des problèmes de qualité figurant dans le tableau 8 concernent des données recueillies dans les années 1980 et 1990. Il convient de souligner que des valeurs semblant valides peuvent également être erronées.
La variable de numéro d’identification du cas (CASE_ID) présente des taux de réponse aux éléments se situant généralement dans la frange supérieure des 90 % (généralement plus de 99 %). Cependant, pour certaines années d’admission, le taux de réponse diminue significativement (jusqu’à 80 % en 1991 et 1992). Par conséquent, toute analyse fondée sur cette variable pour toutes les années d’admission sous-représentera ces années, pour lesquelles le manque de réponse à l’élément est plus élevé (p. ex. 1986, 1987, 1991, 1992, 1993, 2020). Aucune détection des valeurs non valides n’a eu lieu pour la variable de numéro d’identification du cas (CASE_ID).
La variable d’âge à l’admission Landing_age est définie comme non valide lorsqu’elle dépasse 100, même s’il est possible dans certains cas que ces valeurs soient exactes. Il convient de souligner que, selon les valeurs de cette variable, le nombre d’immigrants admis après l’âge de 100 ans était bien plus élevé entre 1987 et 1995 que pour les autres années d’admission. Il pourrait s’agir d’un problème de saisie de données.
Dans le FRPN de la BDIM de 2023, 25 enregistrements présentaient une année de naissance antérieure à 1880 et 15 avaient une année de naissance de 1753 avec une année d’admission après 1985.
Les variables relatives au pays présentent également des problèmes de qualité. Le pays de naissance manque dans certains enregistrements pour pratiquement toutes les années d’admission. Des valeurs manquent, par exemple, pour plus de 100 enregistrements dans chacune des années de 1985 à 1993. Le pays de citoyenneté est manquant pour moins de 20 enregistrements par année d’admission pour la plupart des cohortes (à l’exception des cohortes de 2004, 2005, 2006 et 2007, où plus de 100 valeurs étaient manquantes par année d’admission). Le pays de résidence manque pour de nombreux enregistrements d’admission pour 2011 (cette valeur manque pour 1 810 enregistrements, soit 0,7 % des admissions de cette année‑là), pour 2012 (cette valeur manque pour 5 015 enregistrements, soit 1,9 % des admissions de cette année‑là) et pour 2013 (manquant pour 2 375 enregistrements, soit 0,9 % des admissions de cette année‑là).
Les variables de scolarité avant la cohorte de 2017, après imputation (voir la section 6.3) présentent plus de 150 valeurs manquantes par année d’admission de 1980 à 1984; cela équivaut à un taux de valeurs manquantes par année d’admission de moins de 0,5 %. Une nouvelle variable a été dérivée en utilisant les données d’entrée express pour imputer le niveau de scolarité des personnes admises entre 2015 et 2020.
Le pourcentage de réponses valides pour les variables de profession est plus de 99 % pour toutes les années d’admission.
Les variables de statut dans la famille Family_Status et d'immigrants sélectionnés par le Québec CSQ_IND ont la plupart de leurs valeurs manquants pour les enregistrements des années d’admission antérieures à 1999.
La variable de langue maternelle Mother_Tongue manque pour quelques centaines d'enregistrements entre les années d'admission 1990 et 1995
La langue officielle Official_Language a un nombre croissant de valeurs manquantes ; 2016 à 2023, entre 1 820 et 10 815 par cohorte ont une valeur manquante.
La variable de l’état matrimonial Marital_Status a eu plus de 200 valeurs manquantes par cohorte depuis 2012.
Les variables Destination_CD, Destination_CMA, Destination_CSD et Destination_Province ont moins de valeurs manquantes dans la BDIM 2023 que lors des années précédentes suite à la mise à jour avec la Classification Géographique Type (CGT) de 2016.
Les variables d’année et de mois de décès manquent pour certaines personnes reconnues comme décédées (Death_Indicator=1). La valeur « 9999 » a été attribuée à la variable d’année de décès Death_Year et la valeur « 99 » à celle du mois de décès Death_Month dans les cas où l’année et le mois de décès étaient inconnus.
| Variables du PNRF | Résponses valides | Champs vides | Résponses non valides | |||
|---|---|---|---|---|---|---|
| nombre | pourcentage | nombre | pourcentage | nombre | pourcentage | |
| Notes : FRPN: Fichier intégré des résidents permanents et non permanents. RNP: Résident non permanent. Seules les variables ayant des valeurs manquantes ou invalides ont été incluses dans ce tableau. Tous les chiffres sont arrondis.
Source : Statistique Canada, Base de données longitudinales sur l’immigration 2023. |
||||||
| Case_ID | 9 977 820 | 98,18 | 184 950 | 1,82 | 0 | 0,00 |
| Landing_age | 10 161 660 | 99,99 | 380 | 0,00 | 730 | 0,01 |
| Birth_Year | 10 162 560 | 100,00 | 180 | 0,00 | 20 | 0,00 |
| Gender | 10 162 770 | 100,00 | 0 | 0,00 | 0 | 0,00 |
| Country_Birth | 10 159 870 | 99,97 | 2 890 | 0,03 | 0 | 0,00 |
| Country_Citizenship | 10 161 240 | 99,99 | 1 520 | 0,01 | 0 | 0,00 |
| Country_Residence | 10 149 420 | 99,87 | 13 350 | 0,13 | 0 | 0,00 |
| Education_Qualification | 9 345 490 | 91,96 | 817 280 | 8,04 | 0 | 0,00 |
| Level_of_Education | 10 160 700 | 99,98 | 2 070 | 0,02 | 0 | 0,00 |
| Years_of_Schooling | 10 160 360 | 99,98 | 2 410 | 0,02 | 0 | 0,00 |
| Education_Derived | 9 720 030 | 95,64 | 442 740 | 4,36 | 0 | 0,00 |
| Landing_age_6_groups | 10 162 390 | 100,00 | 380 | 0,00 | 0 | 0,00 |
| Landing_age_9_groups | 10 162 390 | 100,00 | 380 | 0,00 | 0 | 0,00 |
| Occupation_CD | 10 155 210 | 99,93 | 7 560 | 0,07 | 0 | 0,00 |
| NOC5-NOC2 | 10 106 950 | 99,45 | 55 820 | 0,55 | 0 | 0,00 |
| Skill_level_CD11 | 10 155 200 | 99,93 | 7 560 | 0,07 | 0 | 0,00 |
| Family_Status | 10 160 180 | 99,97 | 2 590 | 0,03 | 0 | 0,00 |
| Family_Status_rollup | 10 160 180 | 99,97 | 2 590 | 0,03 | 0 | 0,00 |
| Marital_status | 10 157 050 | 99,94 | 5 710 | 0,06 | 0 | 0,00 |
| Marital_status_rollup | 10 157 050 | 99,94 | 5 710 | 0,06 | 0 | 0,00 |
| Mother_Tongue | 10 160 660 | 99,98 | 2 110 | 0,02 | 0 | 0,00 |
| Official_Language | 10 108 970 | 99,47 | 53 790 | 0,53 | 0 | 0,00 |
| Special_Program | 2 134 350 | 21,00 | 8 028 420 | 79,00 | 0 | 0,00 |
| CSQ_ind | 10 162 540 | 100,00 | 230 | 0,00 | 0 | 0,00 |
| Destination_CD | 10 162 430 | 100,00 | 330 | 0,00 | 0 | 0,00 |
| Destination_CMA | 10 162 430 | 100,00 | 330 | 0,00 | 0 | 0,00 |
| Destination_CSD | 10 162 430 | 100,00 | 330 | 0,00 | 0 | 0,00 |
| Destination_Province | 10 162 430 | 100,00 | 330 | 0,00 | 0 | 0,00 |
| Permits and NPR-specific variables | 2 811 780 | 100,00 | 0 | 0,00 | 0 | 0,00 |
| Death_Year | 10 162 130 | 99,99 | 640 | 0,01 | 0 | 0,00 |
| Death_Month | 10 162 100 | 99,99 | 670 | 0,01 | 0 | 0,00 |
7.5.2 Évaluation de la qualité du Fichier des résidents non permanents (FRN)
Une validation du contenu des fichiers NRF_PERMIT_1980_2023 et NRF_PERSON_1980_2023 a été effectuée. Ces fichiers contiennent des ensembles de variables différents les uns des autres. Dans le tableau 8B, les variables "Landing_Year" à "Number_All_Permits) apparaissent dans le fichier des personnes, tandis que les autres apparaissent dans le fichier des permis. Alors que la collecte des données fiscales et relatives à l’admission est obligatoire pour les personnes dans le champ d’enquête, ces dernières peuvent ne pas remplir tous les champs. Ces champs ont pu être laissés vides parce que le répondant ne connaissait pas la réponse ou pour d’autres raisons, que les utilisateurs des données ne peuvent connaître (p. ex. refus) (McLeish 2011). L’absence de réponse à certaines questions peut présenter des problèmes lorsque la BDIM est utilisée à des fins statistiques, notamment dans les cas suivants :
- Si l’utilisateur de la base de données souhaite produire un échantillon fondé sur les caractéristiques pour lesquelles des enregistrements manquent, une erreur de couverture peut survenir (c.-à-d. les personnes incluses dans la base d’échantillon peuvent ne pas être représentatives de la population cible).
- S’il s’agit d’une absence de données informatives (p. ex. l’absence du renseignement n’est pas un cas aléatoire; l’absence de réponse indique ce que la réponse aurait été), toute analyse utilisant ces variables serait biaisée.
La présence de variables manquantes et de valeurs non valides a été évaluée. Les chiffres présentés dans cette section sont arrondis. Les valeurs non valides sont soit incohérentes, soit non répertoriées dans les tableaux de métadonnées mis à la disposition des utilisateurs (voir la composante immigration de l'annexe du dictionnaire des données). Il convient de noter que certaines valeurs apparemment valides peuvent également être erronées.
La variable Landing_year présente un pourcentage élevé de valeurs manquantes (71,9 %). Ceci est normal puisque seuls les immigrants admis ont une année d’admission et que la NRF inclut tous les résidents non permanents, qu'ils soient devenus résidents permanents ou non.
Dans le fichier NRF_PERSON de la BDIM 2023, 260 enregistrements ont une année de naissance antérieure à 1880, et 250 enregistrements ont une année de naissance antérieure à 1753.
Alors que la plupart des enregistrements ont un pays de naissance (Country_Birth), ceux dont le pays de naissance est manquant ont également une année d'admission manquante.
Les variables Effective_Date et Valid_Date n'ont pas de réponses invalides en elles-mêmes, mais lorsqu'elles sont comparées ensemble, elles peuvent produire des réponses invalides. Par exemple, la Valid_Date doit toujours arriver après la Effective_Date. Les enregistrements dont la date de validité apparaît avant la date d'entrée en vigueur peuvent être considérés comme des réponses non valides pour l'une de ces variables ou les deux. De plus, tout enregistrement dont la durée entre Effective_Date et la Valid_Date est de 5 ans ou plus peut être considéré comme suspect et comprenant probablement une valeur non valide pour une des deux variables. 0,05 % des comparaisons entre les variables Effective_Date et Valid_Date pourraient être considérées comme non valides en raison de ces deux problèmes.
Plus de 99 % des valeurs manquantes de la variable Valid_Date se produisent lorsque la variable Document_Type est 46 (demande d'asile), ce qui s'explique par le fait qu'aucune date de fin n'est attribuée aux demandes d'asile.
Les variables Destination_CD, Destination_ER, Destination_CMA, Destination_CSD et Destination_province présentent une proportion de valeurs manquantes plus faible que les autres variables, mais beaucoup plus importante que le dans le fichier PNRF. La plupart des années avant 2004 (sur la base de la variable Effective_Date) ont un taux de variables manquantes très faible, autour de 1%. Cependant, l'année 1989 a un taux de variables manquantes de près de 12 %. Après 2004, le taux manquant fluctue entre 2 % et 13 %. La BDIM 2023 utilise la Classification géographique standard (CGS) pour mettre à jour la région et le code géographiques.
| Variables du NRF | Résponses valides | Champs vides | Résponses non valides | |||
|---|---|---|---|---|---|---|
| nombre | pourcentage | nombre | pourcentage | nombre | pourcentage | |
| Notes : NPR : résident non permanent. Seules les variables dont les valeurs sont manquantes ou invalides ont été incluses dans le tableau. Tous les chiffres sont arrondis. Les variables Effective_Date et Valid_Date peuvent être invalides lorsqu'elles sont comparées entre elles. Voir le paragraphe de la section 7.5.2 pour plus de détails.
Source : Statistique Canada, Base de données longitudinales sur l’immigration 2023. |
||||||
| Landing Year | 2 811 780 | 28,06 | 7 208 550 | 71,94 | 0 | 0,00 |
| birth_year | 10 018 750 | 99,98 | 1 320 | 0,01 | 260 | 0,00 |
| birth_month | 10 018 960 | 99,99 | 1 370 | 0,01 | 0 | 0,00 |
| gender | 10 020 330 | 100,00 | 0 | 0,00 | 0 | 0,00 |
| COUNTRY_BIRTH | 10 002 430 | 99,82 | 17 900 | 0,18 | 0 | 0,00 |
| NUMBER_OTHER_PERMITS | 10 020 330 | 100,00 | 0 | 0,00 | 0 | 0,00 |
| NUMBER_REFUGEE_CLAIMS | 10 020 330 | 100,00 | 0 | 0,00 | 0 | 0,00 |
| NUMBER_WORK_PERMITS | 10 020 330 | 100,00 | 0 | 0,00 | 0 | 0,00 |
| NUMBER_STUDY_PERMITS | 10 020 330 | 100,00 | 0 | 0,00 | 0 | 0,00 |
| NUMBER_ALL_PERMITS | 10 020 330 | 100,00 | 0 | 0,00 | 0 | 0,00 |
| COUNTRY_RESIDENCE | 22 701 430 | 95,92 | 965 120 | 0,04 | 0 | 0,00 |
| COUNTRY_CITIZENSHIP | 23 621 280 | 99,81 | 45 260 | 0,00 | 0 | 0,00 |
| LEVEL_OF_STUDY_ROLLUP | 8 449 140 | 35,70 | 15 217 410 | 64,30 | 0 | 0,00 |
| LEVEL_OF_STUDY | 8 449 140 | 35,70 | 15 217 410 | 64,30 | 0 | 0,00 |
| SKILL_LEVEL_CD11 | 15 390 590 | 65,03 | 8 275 950 | 34,97 | 0 | 0,00 |
| OCCUPATION_CD | 15 395 250 | 65,05 | 8 271 300 | 34,95 | 0 | 0,00 |
| NOC5_CD11 | 15 982 670 | 67,53 | 7 683 880 | 32,47 | 0 | 0,00 |
| NOC4_CD11 | 15 982 670 | 67,53 | 7 683 880 | 32,47 | 0 | 0,00 |
| NOC3_CD11 | 15 982 670 | 67,53 | 7 683 880 | 32,47 | 0 | 0,00 |
| NOC2_CD11 | 15 982 670 | 67,53 | 7 683 880 | 32,47 | 0 | 0,00 |
| DESTINATION_CSD | 22 437 170 | 94,81 | 1 229 380 | 5,19 | 0 | 0,00 |
| DESTINATION_CMA | 22 437 170 | 94,81 | 1 229 380 | 5,19 | 0 | 0,00 |
| DESTINATION_PROVINCE | 22 437 170 | 94,81 | 1 229 380 | 5,19 | 0 | 0,00 |
| DESTINATION_CD | 22 437 170 | 94,81 | 1 229 380 | 5,19 | 0 | 0,00 |
| DESTINATION_ER | 22 437 170 | 94,81 | 1 229 380 | 5,19 | 0 | 0,00 |
| effective_date | 23 666 550 | 100,00 | 0 | 0,00 | 0 | 0,00 |
| valid_date | 22 472 570 | 94,95 | 1 193 980 | 5,05 | 0 | 0,00 |
| DOCUMENT_TYPE | 23 666 550 | 100,00 | 0 | 0,00 | 0 | 0,00 |
| SPECIAL_PROGRAM | 4 923 120 | 20,80 | 18 743 430 | 79,20 | 0 | 0,00 |
| CLASSIFICATION_ID | 9 235 330 | 39,02 | 14 431 210 | 60,98 | 0 | 0,00 |
| LMIA_EXEMPTIONS | 10 297 280 | 43,51 | 13 369 270 | 56,49 | 0 | 0,00 |
7.6 Évaluation de la qualité de la variable de la province de résidence (PRCO_)
Une validation des variables géographiques incluses dans les fichiers fiscaux de la BDIM a été effectuée. Cette section explique comment la variable Province de résidence (PRCO_) a été dérivée et sa qualité.
La province de résidence (PRCO_) est fondée sur les renseignements fournis par les déclarants, lorsque disponible. Les renseignements manquants pour la province de résidence sont remplacés par les renseignements recueillis sur le code postal de l'adresse postale de l’individu (PSCO_I), si disponible, sinon celui de la famille est utilisé (PSCO_F).
| PRCO | Province et Territoires | Premier caractère du code postal (PSCO) |
|---|---|---|
| Note: Les valeurs de certain codes postales sont U ou F pour les valeurs manquantes, respectivement États‑Unis est U et, étranger est marqué par F. | ||
| 0 | Terre‑Neuve‑et‑Labrador | A |
| 2 | Île‑du‑Prince‑Édouard | B |
| 1 | Nouvelle‑Écosse | C |
| 3 | Nouveau‑Brunswick | E |
| 4 | Québec | G, H, J |
| 5 | Ontario | K, L, M, N ,P |
| 6 | Manitoba | R |
| 7 | Saskatchewan | S |
| 8 | Alberta | T |
| 9 | Colombie‑Britannique | V |
| 10 | Territoires du Nord‑Ouest | X |
| 11 | Yukon | Y |
| 12 | Non‑résidents manquant | manquant |
| 14 | Nunavut | X |
Bien que la province de résidence (PRCO_) soit plus fiable que la province d’imposition (TXPCO_), certaines anomalies ont été observées principalement sur le code des non-résidents dans les déclarations des années d’imposition 1989, 1993 et 1998. Celles-ci peuvent avoir une incidence sur certaines provinces.
Pour l’année d’imposition 1993, la IMDB_T1FF comprend des anomalies pour la province du Manitoba qui compte un nombre inhabituel de résidents (48 130 en 1993, comparativement à 33 650 l'année d'imposition précédente et à 37 365 l'année d'imposition suivante). Des changements semblables sont observés dans les Territoires du Nord-Ouest. De plus, 740 personnes sont codées comme résidant au Nunavut alors que le Nunavut a été créé en 1998. 725 personnes sont codées comme résidant dans plusieurs juridictions. Les utilisateurs peuvent utiliser l'information de la variable PSCO_F pour diminuer l'effet des anomalies sur leurs analyses qui incluent la province de résidence. Toutefois, comme nous l'avons indiqué plus haut, le moment est différent entre PSCO (basé sur le lieu de résidence lors de la transmission de la déclaration) et PRCO_ (lieu de résidence au 31 décembre).
Les enregistrements des non-résidents (PRCO_=12) semblent surestimés dans le fichier IMDB_T1FF de 1989. Il comprend 79 210 non-résidents du Canada, dont bon nombre ont un statut de résident non permanent. Les utilisateurs peuvent décider d'utiliser le code postal de l'adresse postale (PSCO_ au niveau individuel ou familial) pour calculer la valeur du PRCO_ ou retirer les non-résidents de leur analyse.
Dans le fichier FFT1 de la BDIM de 1998, IMDB_T1FF_1998, un nombre plus élevé que prévu d'enregistrements est attribué à Terre-Neuve-et-Labrador (PRCO_). Dans ces cas, le lieu de résidence de la famille au moment du dépôt de la demande est également Terre-Neuve selon la variable PSCO_F.
- Date de modification :