Base de données longitudinales sur l’immigration (BDIM) Rapport technique, 2023
7 Évaluation des données et indicateurs de qualité

Passer au texte

Début du texte

7.1 Sources d’erreurs

Parce que la BDIM est produite à partir de plusieurs couplages d’enregistrements, elle comprend différentes sources d’erreurs, notamment des erreurs de couplage d’enregistrements, de mesure et de couverture. Nous expliquons, dans cette section, les sources d’erreurs et indiquerons l’importance de certaines d’entre elles.

Il convient de noter que, puisqu’il s’agit du recensement des immigrants déclarants admis depuis 1980, aucune pondération n’a été créée au sein de la BDIM. Aucune rectification n’est apportée aux années d’imposition manquantes ni aux erreurs de couplage, aucun échantillonnage n’a lieu et tous les déclarants couplés sont conservés dans l’ensemble de données final. Cependant, le couplage lui-même présente une forme d’erreur d’échantillonnage dans le cas d’échecs de couplage.

7.1.1 Erreurs de couplage d’enregistrements

Les ensembles de données produits à partir des résultats des couplages d’enregistrements peuvent comprendre des erreurs de couplage d’enregistrements. Deux types d’erreurs sont ainsi possibles : des faux positifs (fausses correspondances) et des faux négatifs (fausses non correspondances). Un couplage est un faux positif lorsque deux enregistrements ne concernant pas la même personne sont comptés comme une correspondance. Un couplage est un faux négatif lorsque deux enregistrements concernant la même personne sont comptés comme une non correspondance.

Il est possible de manquer une partie de l’historique d’un immigrant, puisque certains possèdent plusieurs numéros d’assurance sociale (NAS) au cours du temps (NAS temporaire attribué à l’admission au résident non permanent, puis NAS permanent attribué après l’admission). Ces deux NAS sont nécessaires pour constituer l’historique fiscal complet depuis l’admission de la personne au Canada. Le FCC et l’ECDS (décrit à la section 2.3) permettent de recenser ces deux NAS. Il est possible que, dans quelques cas, des liens entre les NAS échouent ou que des liens erronés soient créés.

7.1.2 Erreurs de mesure

Une erreur de mesure est la différence entre la valeur mesurée d’une variable et sa valeur réelle. On peut attribuer ce type d’erreur à plusieurs facteurs, notamment la saisie de données (p. ex. coquilles) et les erreurs des répondants (p. ex. mauvaise interprétation de la question posée). On a tenu compte de ce type d’erreur lors de la création du Fichier intégré des résidents permanents et non permanents (FRPN) pour éviter les renseignements contradictoires pour toute personne. Lorsqu’un enregistrement existe pour une personne dans le FIR et dans le FRN, par exemple, et que les variables sociodémographiques présentent des valeurs incohérentes, les valeurs à l’admission (celles du FIR) sont conservées. Voir les sections 7.2 et 7.5 qui fournissent certains chiffres.

7.1.3 Erreurs de couverture

Les erreurs de couverture proviennent d’omissions, de l’inclusion d’unités erronées, d’enregistrements en double et d’erreurs de classification d’enregistrements dans la base de données. Ces erreurs de couverture peuvent provenir d’une couverture inadéquate de la population. Elles peuvent se traduire par des estimations biaisées et les répercussions peuvent varier pour différents sous-groupes de la population. Ces erreurs entraînent souvent un sous-dénombrement. Le sous-dénombrement dans le cadre de la BDIM provient en partie de l’exclusion de la base de données des fichiers de données fiscales d’immigrants déclarants. Aucun enregistrement ne figure dans le fichier IMDB_T1FF pour les immigrants qui ne produisent pas de déclaration de revenus pour une année donnée ou qui le font en retard, même s’ils sont couplés aux données fiscales et font partie de la population d’intérêt. Si, pour une raison quelconque, l’enregistrement d’un immigrant n’est pas inclus dans le Fichier des immigrants reçus (FIR), il ne fera pas partie de la BDIM. Un surdénombrement survient lors de l’ajout à la base de données d’enregistrements exclus de la population cible. Un immigrant peut faire l’objet de plusieurs enregistrements dans le FIR du fait de plusieurs admissions non reconnues comme telles, par exemple. Veuillez-vous reporter à la section 7.4 et à l’annexe B pour de plus amples détails relatifs à la couverture de la BDIM.

7.2 Exactitude des données

Cette section porte sur l’exactitude des données relatives à l’immigration. Pour de plus amples détails sur l’exactitude du FFT1, veuillez-vous reporter au document sur le FFT1 (numéro d’enregistrement 4105).

L’exactitude de la BDIM dépend de la représentativité de la population qui y est incluse. Une étude menée au cours des premières années de la BDIM a conclu que cette dernière « semble être représentative de la population la plus susceptible de produire des déclarations de revenus. Par conséquent, les résultats obtenus à partir de la BDIM ne devraient pas être appliqués à la population immigrante dans son ensemble, mais plutôt à l’univers des immigrants qui produisent des déclarations de revenus » (Carpentier et Pinsonneault, 1994).

Les raisons expliquant les différences entre les déclarants et la population totale des personnes nées à l’étranger sont expliquées dans un article de Badets et Langlois (2000) décrivant les défis d’utilisation de la BDIM :

Les caractéristiques de la population immigrante qui produit des déclarations de revenus diffèrent de celles de l’ensemble de la population née à l’étranger, étant donné que la probabilité ou la nécessité de produire une déclaration de revenus varie selon l’âge, la situation familiale de la personne et d’autres facteurs. On pourrait s’attendre à ce qu’un pourcentage plus élevé d’immigrants de sexe masculin produisent une déclaration de revenus, notamment parce qu’ils ont des taux de participation au marché du travail plus élevés que les femmes. Le niveau de « saisie » des immigrants dans la BDIM est aussi influencé par les changements touchant l’impôt sur le revenu. Par exemple, la mise en place de programmes de crédits d’impôt non remboursables à l’échelle fédérale et provinciale incite les personnes qui n’ont pas de revenus imposables à produire une déclaration de revenus pour être admissibles à certains crédits d’impôt.

Ces commentaires sur la représentativité de la BDIM s’appliquent toujours.

7.2.1 BDIM de 2023: Taux de couplage

Cette section porte sur la BDIM de 2023. Le taux global de couplage entre les données d'immigration d'IRCC et le Dépôt d’enregistrements dérivés de l’ECDS était de 97,5 % (voir section 4). Un lien ne signifie pas nécessairement qu'une déclaration fiscale est disponible puisqu'il est possible de coupler les personnes à charge des déclarants ou des immigrants qui n'ont pas encore produit leur déclaration de revenus. Ce taux de couplage théorique informe principalement sur la façon dont les fichiers d’IRCC pourraient être associés dans un environnement référentiel plus large.

Parmi les immigrants admis entre 1980 et 2023, 85,7 % étaient liés à au moins un FFT1. Ce taux représente la couverture effective du couplage entre les déclarations fiscales et les fichiers d'immigration. Tel que présenté dans les statistiques suivantes, ce taux de couverture peut varier selon le sexe et l'âge.

La proportion de déclarants couplés selon le groupe d'âge au moment de l'admission et le sexe est indiquée au tableau 4. On s'attend à ce que les taux plus faibles pour le groupe d'âge de 0 à 14 ans soient observés puisque les personnes de ce groupe d'âge ne sont pas en âge de travailler. Voir l'annexe B pour les taux selon le sexe, le groupe d'âge et la cohorte d'admission.

Tableau 4
Proportion de déclarants couplés, par tranche d’âge à l’admission et par sexe Sommaire du tableau
Le tableau montre les résultats de Proportion de déclarants couplés, par tranche d’âge à l’admission et par sexe 15 à 24 ans , 50 à 64 ans, Total, Âge à l’admission, 65 ans et plus, 25 à 34 ans, 0 à 14 ans et 35 à 49 ans, calculées selon pourcentage unités de mesure (figurant comme en-tête de colonne).
  Âge à l’admission
0 à 14 ans 15 à 24 ans 25 à 34 ans 35 à 49 ans 50 à 64 ans 65 ans et plus Total
pourcentage
Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2023.
Hommes 57,9 90,3 92,0 91,7 87,8 74,8 83,6
Femmes 57,0 89,5 91,5 92,2 85,9 73,6 83,6
Total 57,5 89,9 91,7 91,9 86,8 74,1 83,6

À mesure que les immigrants vieillissent, ils commencent à produire des déclarations de revenus et sont inclus dans la BDIM. Le graphique 1 montre que, parmi les immigrants admis à tout âge de 0 à 14 ans, la proportion de déclarants couplés est supérieure pour les immigrants admis avant 2000 que pour ceux admis depuis 2000. Les immigrants récents ont des taux de couplage inférieurs. Voir l’annexe B pour un tableau présentant la proportion de déclarants couplés par groupe d’âge à l’admission, sexe et décennie d’admission.

Graphique 1 Proportion de déclarants couplés, par tranche d'âge à l'admission et décennie d'admission

Tableau de données du graphique 1
Tableau de données du graphique 1 Sommaire du tableau
Le tableau montre les résultats de . Les données sont présentées selon Cohorts (titres de rangée) et Tranche d'âge, 0 à 14 ans, 25 à 34 ans, 50 à 64 ans, 15 à 24 ans , 35 à 49 ans et 65 ans et plus, calculées selon proportion unités de mesure (figurant comme en-tête de colonne).
Cohorts Tranche d'âge
0 à 14 ans 15 à 24 ans 25 à 34 ans 35 à 49 ans 50 à 64 ans 65 ans et plus
proportion
Source: Statistics Canada, 2023 Longitudinal Immigration Database.
Cohortes de 1980 à 1989 0,82 0,93 0,94 0,93 0,83 0,61
Cohortes de 1990 à 1999 0,81 0,92 0,93 0,93 0,89 0,76
Cohortes de 2000 à 2009 0,78 0,93 0,92 0,93 0,93 0,88
Cohortes de 2010 à 2019 0,32 0,95 0,96 0,95 0,92 0,86
Cohortes de 2020 à 2022 0,01 0,81 0,92 0,93 0,82 0,69

Le graphique 2 illustre la proportion de déclarants ainsi que le nombre de déclarants et de non-déclarants par année d’admission; la mention « non déclarant » indique qu’aucun enregistrement dans le FFT1 n’est disponible. Dans la BDIM de 2023, le taux de déclaration varie en fonction de l’année d’admission, de 67,7 % pour les personnes admises en 2022 à 91,3 % pour celles admises en 1989. Le taux de déclaration augmente à mesure du nombre d’années de présence des immigrants au Canada; cela peut expliquer pourquoi les taux de couplage sont supérieurs pour les immigrants admis dans les années 1990 et le début des années 2000. Voir l’annexe B, tableaux 14 et 15, pour connaître des chiffres de répartition détaillés par année d’admission.

Graphique 2 Répartition des déclarants et des non-déclarants par année d'admission

Tableau de données du graphique 2
Tableau de données du graphique 2 Sommaire du tableau
Le tableau montre les résultats de . Les données sont présentées selon Année d'admission (titres de rangée) et Taux, Déclarants et Non-déclarants, calculées selon pourcentage et nombre d'immigrants unités de mesure (figurant comme en-tête de colonne).
Année d'admission Déclarants Non-déclarants Taux
nombre d'immigrants pourcentage
Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2023.
1980 120 380 22 620 84,2
1981 107 660 20 810 83,8
1982 103 360 17 600 85,4
1983 77 080 11 880 86,6
1984 77 430 10 520 88,0
1985 75 010 8 870 89,4
1986 89 030 9 650 90,2
1987 137 510 13 490 91,1
1988 146 170 14 340 91,1
1989 173 760 16 630 91,3
1990 192 060 23 010 89,3
1991 208 460 22 970 90,1
1992 228 580 24 940 90,2
1993 230 570 24 570 90,4
1994 198 430 24 530 89,0
1995 188 490 23 070 89,1
1996 198 230 26 350 88,3
1997 189 050 25 600 88,1
1998 155 270 17 900 89,7
1999 168 770 20 070 89,4
2000 203 580 22 510 90,0
2001 224 810 24 110 90,3
2002 204 730 22 600 90,1
2003 197 950 21 690 90,1
2004 212 500 22 920 90,3
2005 235 020 26 780 89,8
2006 225 180 26 050 89,6
2007 210 770 25 640 89,2
2008 217 220 29 560 88,0
2009 221 580 30 250 88,0
2010 241 450 38 810 86,2
2011 211 230 36 900 85,1
2012 218 590 38 440 85,0
2013 218 240 40 190 84,4
2014 220 310 39 550 84,8
2015 226 180 45 140 83,4
2016 236 040 59 610 79,8
2017 234 030 51 740 81,9
2018 252 920 67 240 79,0
2019 261 890 78 340 77,0
2020 144 360 39 560 78,5
2021 327 470 77 360 80,9
2022 295 580 140 830 67,7

7.2.2 Disponibilité de la date de décès

L’année et le mois d’un décès, ainsi que l’indicateur de décès, sont inclus dans le FRPN.  Dans la BDIM de 2021, ces variables ont été couplées à l'aide de la Base canadienne de données sur la mortalité (BCDM). Dans le passé, ces variables étaient fondées sur la Base de mortalité amalgamée (BMA) de Statistique Canada, qui est un ensemble de données archivé qui combine des enregistrements entre la BCDM, les statistiques de l'état civil, et des fichiers fiscaux. La BCDM est une base de données administratives qui recueille des renseignements sur les dates et les causes de décès dans tous les registres provinciaux et territoriaux de l'état civil au Canada. Un certain sous-dénombrement, bien que minime, existe dans la base de données, car il ne comprend pas les décès de Canadiens (1) qui sont morts à l'extérieur du Canada, à l'exception des États-Unis ; (2) qui ont servi comme membres des Forces canadiennes, ou (3) dont les corps n'ont pas été identifiés. Il est à noter que la BCDM ne comprend pas les décès qui ont été déclarés dans les dossiers fiscaux.

Le graphique 3 décrit la tendance générale du nombre de décès par an depuis 1974 pour les immigrants arrivés depuis 1952. Les données antérieures à 1980 ont été ajoutées récemment à la BDIM. La valeur « 9999 » représente les enregistrements d’immigrants décédés pour lesquels l’année de décès n’est pas disponible.

Graphique 3 Résidents permanents et non permanents par année de décès

Tableau de données du graphique 3
Tableau de données du graphique 3 Sommaire du tableau
Le tableau montre les résultats de . Les données sont présentées selon Année de décès (titres de rangée) et Résidents permanents entre 1952 et 1979 et Résidents permanents depuis 1980, calculées selon nombre de décès unités de mesure (figurant comme en-tête de colonne).
Année de décès Résidents permanents entre 1952 et 1979 Résidents permanents depuis 1980
nombre de décès
Note .

indisponible pour toute période de référence

Note : La valeur 9999 a été utilisée lorsque la date de décès n'était pas disponible.
Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2023.
1974 4 840 . indisponible pour toute période de référence
1975 5 270 . indisponible pour toute période de référence
1976 5 590 . indisponible pour toute période de référence
1977 6 220 . indisponible pour toute période de référence
1978 6 530 . indisponible pour toute période de référence
1979 7 090 . indisponible pour toute période de référence
1980 7 700 90
1981 7 610 300
1982 7 950 510
1983 8 530 740
1984 8 950 950
1985 9 370 1 110
1986 10 090 1 340
1987 10 470 1 630
1988 11 100 1 900
1989 11 550 2 210
1990 11 850 2 450
1991 12 660 2 910
1992 13 230 3 210
1993 14 000 3 750
1994 14 510 4 280
1995 15 310 4 730
1996 15 720 5 130
1997 16 180 5 450
1998 16 750 5 770
1999 17 540 6 190
2000 17 560 6 400
2001 18 020 6 940
2002 18 710 7 320
2003 19 200 8 100
2004 19 430 8 280
2005 20 160 8 660
2006 20 390 9 140
2007 21 360 9 860
2008 21 850 10 280
2009 22 360 10 770
2010 22 720 11 130
2011 23 010 11 920
2012 23 540 12 180
2013 24 830 13 200
2014 25 410 14 110
2015 26 290 15 010
2016 26 910 15 860
2017 27 740 17 210
2018 28 030 18 120
2019 28 180 19 020
2020 31 370 23 340
2021 30 760 24 650
2022 32 280 23 420
9999 30 640

7.2.3 Déclarants avant l’admission par rapport aux enregistrements du Fichier des résidents non permanents (FRN)

Les résultats inclus dans cette section sont tirés d’une étude fondée sur la BDIM de 2014. Les déclarants avant l’admission sont des immigrants qui ont produit une déclaration de revenus avant leur année d’admission. Il est parfois déduit que tous les déclarants avant l’admission sont des immigrants qui étaient des résidents non permanents avant leur admission. Cette section explique pourquoi ce n’est pas le cas. Au total, 1,26 million de personnes ont produit une déclaration de revenus avant leur admission officielle depuis 1980; sur ce total, 212 500 ne sont pas couplées à un enregistrement de résident non permanent, contrairement à ce à quoi l’on pourrait s’attendre. Après une enquête approfondie, on a découvert que la plupart des déclarants avant l’admission qui étaient des résidents permanents non couplés à un enregistrement de résident non permanent étaient probablement des immigrants ayant produit une déclaration de revenus lorsque cela n’était pas requis : 96 % de ces déclarants avant l’admission ont uniquement produit une déclaration de revenus pour l’année précédant leur année d’admission et 75 % n’ont déclaré aucun revenu (96 % n’avaient aucun salaire). Comme le montre le graphique 4, la plupart de ces déclarants avant l’admission ont été admis au cours des premiers mois de l’année, avant la date d’échéance de la production d’une déclaration de revenus pour l’année précédente. Il semble que certains immigrants admis avant le mois de mai ont produit une déclaration de revenus pour l’année précédant leur année d’admission; ce qu’ils n’étaient pas tenus de faire.

Selon ces résultats, il est justifié de supprimer les enregistrements présentant les variables de déclarant avant l’admission Prefiler_ind=1 et FIRST_EFFECTIVE_YEAR=. des études sur les immigrants ayant une expérience avant leur admission dépend de l’analyse, puisque FIRST_EFFECTIVE_YEAR=. signifie qu’aucun enregistrement ne figure dans le fichier de permis de résidents non permanents.

Graphique 4 Réparatition des déclarants avant l'admission sans permis de résidence non permanente, par mois d'admission

Tableau de données du graphique 4
Tableau de données du graphique 4 Sommaire du tableau
Le tableau montre les résultats de . Les données sont présentées selon Mois d'admission (titres de rangée) et , calculées selon (figurant comme en-tête de colonne).
Mois d'admission nombre d'immigrants
Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2014.
janvier 32 300
février 36 100
mars 35 500
avril 24 100
mai 20 500
juin 18 200
juillet 16 100
août 11 200
septembre 9 800
octobre 5 500
novembre 2 000
décembre 1 200

Tous les immigrants ayant une expérience avant leur admission ne sont pas considérés comme étant des déclarants avant l’admission : 478 100 immigrants disposent d’enregistrements de résidents non permanents avec la variable Prefiler_ind=0. En fonction du sujet étudié, utiliser la variable FIRST_EFFECTIVE_YEAR<>. ou le nombre de permis de résidence temporaire (variable NUMBER_ALL_PERMITS) est plus approprié pour étudier les immigrants ayant une expérience avant leur admission. La variable Prefiler_ind=0 indique qu’aucune déclaration de revenus n’a été produite avant l’admission, mais elle ne signifie pas que la personne n’a pas d’expérience au Canada avant son admission.

7.2.4 Indicateur de conjoint

La BDIM contient des variables permettant aux utilisateurs de données d’obtenir des renseignements sur l’état matrimonial et les conjoints. La section suivante présente les résultats d’une étude menée sur la BDIM de 2012. Aucune modification majeure n’a été apportée depuis aux codes d’état matrimonial ni à l’indicateur relatif à la famille.

L’identificateur de conjoint (SP__IDI) est dérivé des fichiers de données fiscales. Ce renseignement peut uniquement être dérivé lorsque le répondant déclare son conjoint ou sa conjointe lors de sa déclaration de revenus; cela entraîne une sous-estimation des couples par rapport à l’état matrimonial déclaré dans les fichiers de données fiscales. Il est également possible à partir du FFT1 d’obtenir l’état matrimonial au moment de la déclaration.

Avant 1991, la catégorie « célibataire » n’était pas proposée comme état matrimonial (MSTCO). La catégorie « conjoint de fait » est disponible depuis 1992 pour tous les ensembles de données (1982 à 2012). Depuis 1992, la proportion des enregistrements de la BDIM indiquant un état matrimonial « célibataire » varie entre 20 % et 30 %. La proportion de personnes « séparées » a diminué, passant de 30 % avant 1992 à 4 % par la suite. Des modifications de tendance n’ont pas influé sur les autres catégories d’état matrimonial.

Une analyse portant sur la répartition de l’état matrimonial (MSTCO des fichiers de données fiscales) et l’identificateur de conjoint (SP__IDI) a révélé des différences entre ces deux variables. Ces différences sont dues à l’absence de valeurs d’état matrimonial dans certains enregistrements. Dans une situation parfaite, les enregistrements de toutes les personnes mariées présenteraient des renseignements sur le conjoint et ceux de toutes les personnes célibataires n’en indiqueraient pas. L’analyse effectuée a indiqué que la qualité des données s’était améliorée après 1992, lorsque les états matrimoniaux distincts « conjoint de fait » et « célibataire » ont été introduits.

Lacunes d’indication de conjoint

À la suite d’un examen de l’historique longitudinal des immigrants sur la BDIM de 2012, on a relevé des cas où le conjoint ou conjoint de fait manquait (ou différait) pour une année donnée et où le même conjoint était déclaré deux ou trois ans plus tard. Le graphique 5 fournit un résumé de ces lacunes.

Graphique 5 Proportion des cas présentant un identificateur de conjoint (SP_IDI) incohérent, par année d'admission

Tableau de données du graphique 5
Tableau de données du graphique 5 Sommaire du tableau
Le tableau montre les résultats de . Les données sont présentées selon Tax year (titres de rangée) et , calculées selon (figurant comme en-tête de colonne).
Tax year Pourcentage
Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2012.
1980 16,8
1981 16,6
1982 17,1
1983 17,7
1984 17,4
1985 17,7
1986 17,7
1987 16,9
1988 14,4
1989 13,9
1990 13,4
1991 14,4
1992 13,5
1993 12,7
1994 9,8
1995 9,4
1996 8,7
1997 8,1
1998 7,8
1999 7,1
2000 6,3
2001 5,6
2002 5,0
2003 4,6
2004 4,0
2005 3,1
2006 2,9
2007 2,4
2008 1,8
2009 1,1
2010 0,7
2011 0,5

La plupart des immigrants du fichier ont un conjoint ou non entre 1980 et 2012 selon les fichiers IMDB_T1FF. Il faut souligner qu’aucun état matrimonial (et aucun renseignement sur le conjoint) n’est disponible pour 1,2 million d’immigrants sur environ 6 millions d’immigrants.

7.3 Variables imputées

7.3.1 Imputation des variables relatives à la scolarité

Un problème de qualité des données a en outre été relevé quant aux variables relatives au niveau de scolarité et aux années d’études. Une proportion non négligeable de personnes n’ayant pas déclaré leur niveau de scolarité ou d’années d’études ont reçu le code « 0 » soit « aucun » plutôt que « manquant » pour les variables EDUCATION_QUALIFICATIONS et YEARS_OF_SCHOOLING. Ce problème est devenu courant de 2011 à 2014. En 2011, 35 % des immigrants ont indiqué ne pas avoir suivi d’études, par rapport à environ 10 % dans les années 1990.

Ce problème a été résolu en imputant des variables de scolarité à partir des moyennes des valeurs des variables de scolarité de 2008 à 2010, pour refléter les variables de scolarité de l’année la plus récente. Pour cette imputation, on a utilisé des variables telles que l’âge à l’admission, le groupement de catégories d’immigration 2, la profession envisagée, le sexe et le pays de dernière résidence. La méthodologie d’imputation du plus proche voisin a été employée. La variable d’imputation de la scolarité Education_imputation_ind (0: non; 1: oui), disponible dans le FRPN, a été créée pour déterminer les enregistrements au sein desquels les variables de scolarité ont été imputées.

Pour les immigrants admis en 2016, le nombre de cas où une scolarité non-déclarée a reçu le code « 0 » ou « aucun » plutôt que « manquant » a été réduit. Cependant, un nombre non négligeable d’enregistrements avait un niveau de scolarité manquant avec des années d’études valides. Pour ces enregistrements, les années d’études ont été utilisées pour imputer une valeur pour le niveau de scolarité.

Pour les demandeurs principaux admis depuis 2015, sous le processus d’entrée express,  les années de scolarisation sont sous-estimées.

Pour la BDIM 2023, les personnes admises entre 2015 et 2023 qui ont été connectées au dossier Express Entry ont vu leur éducation imputée en utilisant les valeurs trouvées dans le fichier Express Entry. Une variable d’éducation plus complète, Education_Derived, a été créée, combinant les données de Educatoin_Qualification pour ceux qui n’ont pas été trouvés dans le fichier Express Entry, et les nouvelle valeurs provenant de Express Entry.

Les utilisateurs devraient noter que les valeurs du fichier d’Express Entry sont basées sur l’évaluation par l’agent d’immigration des qualifications scolaires du demandeur dans le contexte d’une équivalence canadienne, alors que les valeurs de Education_Qualification sont auto-déclarées par le demandeur et ne reflète pas nécessairement l’équivalence canadienne.

Education_Derived a été imputée à  ‘manquant’ pour les personnes admises en 2024 ou plus tard.

7.3.2 Imputation des variables relatives à la langue

Deux variables linguistiques ont été ajoutées à la BDIM, English_IND et French_IND, indiquant la première langue officielle connue à l’admission. Pour ceux qui ont été admis en 2018 ou avant, ils sont définis comme des résidents permanents ayant français (anglais) comme langue maternelle ou ayant une langue maternelle autre que l’anglais ou le français et déclarant le français seulement (anglais seulement) comme  la langue officielle connue à l’admission.

Pour les personnes admises en 2019 ou plus tard, elles sont définies comme des résidents permanents ayant déclaré français seulement (anglais seulement) comme langue officielle à l’admission ou ayant déclaré l’anglais et le français comme leur connaissance de la langue officielle à l’admission et déclarant le français (l’anglais) comme la langue dans laquelle ils sont le plus à l’aise.

7.4 Couverture

7.4.1 Couverture du Fichier intégré des résidents permanents et non permanents (FRPN)

Le Fichier intégré des résidents permanents et non permanents (FRPN) de 2023 contient plus de 9,6 millions d’enregistrements (tableau 5); parmi ceux-ci, plus de 8,3 millions (85,7 %) sont couplés à au moins un fichier de données fiscales. Il faut noter que les données sur l’immigration des non-déclarants et les déclarants sont incluses dans un fichier intitulé PNRF_ 1980_2023. Le tableau suivant présente la répartition des enregistrements en fonction de leur présence dans les différents fichiers d’immigration et de données fiscales. Environ 2,5 million d’enregistrements portent sur des immigrants qui étaient des résidents temporaires avant de devenir résidents permanents; plus de 2,4 million de ces enregistrements sont couplés à au moins un fichier de données fiscales. Voir l’annexe B pour des chiffres de répartition détaillés par année d’admission.

Tableau 5
Couverture des résidents permanents Sommaire du tableau
Le tableau montre les résultats de Couverture des résidents permanents Résidents permanents, Résidents permanents ayant un permis de résidence non permanente et Nombre de déclarants, calculées selon nombre, et pourcentage unités de mesure (figurant comme en-tête de colonne).
  Résidents permanents Résidents permanents ayant un permis de résidence non permanente Nombre de déclarants
nombre
Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2023.
Total des déclarants 5 850 820 2 456 110 8 306 940
Total des non déclarants 1 244 600 140 590 1 385 190
Total 7 095 430 2 596 700 9 692 130
  pourcentage
Pourcentage de déclarants 82,5 94,6 85,7

Les données relatives aux immigrants possédant des permis de résidence non permanente sont disponibles. La proportion d’immigrants ayant une expérience avant l’admission varie en fonction de l’année d’admission (graphique 6); elle va de 3,8 % en 1980 à 69,3 % en 2023. Par conséquent, la proportion d’immigrants ayant une expérience avant l’admission au début des années 1980 est sous-représentée. La proportion des immigrants déclarants possédant une expérience avant leur admission (ligne pleine) est supérieure à la proportion globale des immigrants possédant une expérience avant leur admission (ligne pointillée), car le taux de couplage de ces immigrants est supérieur à celui des immigrants sans expérience avant leur admission.

Graphique 6 Réparatition des immigrants avec permis de résidence non permanente, par année d'admission

Tableau de données du graphique 6
Tableau de données du graphique 6 Sommaire du tableau
Le tableau montre les résultats de . Les données sont présentées selon Année d'admission (titres de rangée) et Tous les immigrants, Déclarants et Non-déclarants, calculées selon pourcentage unités de mesure (figurant comme en-tête de colonne).
Année d'admission Tous les immigrants Déclarants Non-déclarants
pourcentage
Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2023.
1980 3,8 4,0 2,5
1981 11,3 12,4 5,6
1982 14,2 15,5 6,7
1983 17,3 18,8 7,6
1984 19,8 21,3 8,8
1985 20,0 21,3 8,6
1986 24,7 26,3 9,7
1987 23,4 24,8 8,5
1988 11,5 12,0 6,0
1989 13,6 14,3 6,9
1990 16,5 17,6 7,8
1991 32,0 34,2 12,6
1992 34,7 36,9 14,6
1993 26,8 28,4 12,1
1994 18,1 19,4 7,5
1995 19,9 21,4 7,4
1996 19,6 21,3 6,5
1997 17,4 19,0 5,7
1998 19,3 20,7 6,9
1999 19,0 20,5 6,6
2000 18,2 19,6 6,0
2001 16,3 17,4 5,7
2002 15,1 16,3 4,8
2003 15,7 17,0 4,6
2004 19,2 20,7 5,3
2005 20,0 21,7 5,2
2006 22,7 24,7 5,3
2007 23,3 25,5 5,0
2008 23,2 25,7 4,7
2009 24,1 26,7 5,1
2010 22,9 25,9 4,4
2011 23,6 26,8 5,1
2012 25,4 29,0 5,0
2013 26,9 30,8 5,4
2014 34,1 39,1 6,4
2015 33,2 38,6 6,3
2016 30,0 36,2 5,7
2017 38,0 44,6 8,2
2018 37,4 44,6 10,3
2019 37,0 44,8 11,0
2020 47,4 55,3 18,8
2021 69,3 76,6 38,3
2022 41,6 53,3 17,1

7.4.1.2 Couverture des résidents non permanents

Cette section décrit la couverture des individus qui ont seulement des permis de résidence non permanente depuis 1980, les données fiscales sont disponibles pour 31,5 % de ces personnes. Parmi les individus qui ne sont pas devenus des résidents permanents, les titulaires d'un permis de travail ont le plus haut taux de couverture, des données fiscales sont disponibles pour 40,3 % de cette population (voir le tableau 6). Il y a une grande variété de permis de résidence non permanente. Certains sont d’une durée aussi courte qu’un jour.

Tableau 6
Couverture des réseidents non permanent qui n'ont jamais obtenu la résidence permanente par type de permis Sommaire du tableau
Le tableau montre les résultats de Couverture des réseidents non permanent qui n'ont jamais obtenu la résidence permanente par type de permis Avec permis d'étude, Demande d'asile, Avec permis de travail et Total, calculées selon nombre, et pourcentage unités de mesure (figurant comme en-tête de colonne).
  Avec permis de travail Avec permis d'étude Demande d'asile Total
nombre
Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2023.
Total déclarants 1 953 280 979 150 229 780 2 269 540
Total non déclarants 2 888 540 2 106 160 383 510 4 939 010
Total 4 841 820 3 085 310 613 290 7 208 550
  pourcentage
pourcentage de déclarants 40,3 31,7 37,5 31,5

7.4.2 Taille du Fichier sur la famille T1 et couverture par année

Les fichiers de données fiscales sont disponibles à partir de 1982 pour les résidents permanents couplés. Certains résidents permanents étaient des résidents non permanents avant leur admission. Le tableau 7 fournit des détails sur la répartition des résidents permanents couplés, avec ou sans permis de résidence non permanente avant leur admission, par année d’imposition. Au moins un fichier de données fiscales est disponible pour 82,5 % de résidents permanents sans permis de résidence non permanente avant leur admission et pour 94,6 % de résidents permanents qui étaient résidents non permanents avant leur admission. Le fait que les résidents permanents possédant des permis temporaires avant leur admission présentent un taux plus élevé de déclarations de revenus que les résidents permanents sans permis avant leur admission peut s’expliquer par une exigence relative au processus de demande de résidence permanente pour les résidents non permanents.

Les résidents non permanents qui demandent la résidence permanente doivent en effet respecter l’obligation de déclaration de revenus au Canada. Le nombre de déclarants dans le fichier IMDB_T1FF augmente à mesure des années, puisque la taille de la population dans le champ d’enquête augmente.

Tableau 7
Résidents permanents et non permanents par année d’imposition Sommaire du tableau
Le tableau montre les résultats de Résidents permanents et non permanents par année d’imposition. Les données sont présentées selon Année (titres de rangée) et Résidents permanents admis avant 1980, Résidents permanents ayant un permis non-permanent , Résidents permanents depuis 1980, Résidents non-permanents uniquement et Nombre de déclarants, calculées selon nombre et pourcentage unités de mesure (figurant comme en-tête de colonne).
Année Résidents permanents admis avant 1980 Résidents permanents depuis 1980 Résidents permanents ayant un permis non-permanent Résidents non-permanents uniquement Nombre de déclarants
nombre
Note ...

n'ayant pas lieu de figurer

Notes : Les résidents permanents depuis 1980 excluent les cohortes d'immigrants après 2023. Les statistiques sur les résidents non permanents portent sur les personnes qui ont obtenu leur premier permis entre 1980 et 2023.
Source : Statistique Canada, Base de données longitudinales sur l'immigration 2023.
1982 1 645 780 190 480 56 430 25 510 1 912 530
1983 1 627 060 226 270 66 380 23 670 1 937 690
1984 1 622 790 265 520 80 890 24 070 1 987 320
1985 1 603 960 299 800 96 050 22 770 2 016 370
1986 1 659 710 357 980 126 210 26 810 2 163 640
1987 1 639 830 417 590 159 720 27 010 2 236 500
1988 1 660 280 509 970 201 670 36 060 2 399 300
1989 1 687 610 623 920 265 180 48 390 2 615 450
1990 1 696 680 745 320 312 680 51 740 2 795 930
1991 1 693 850 842 950 361 420 51 500 2 938 760
1992 1 700 290 949 090 405 350 51 050 3 094 360
1993 1 732 760 1 093 230 444 760 51 010 3 309 580
1994 1 717 460 1 214 590 470 230 50 170 3 440 080
1995 1 701 320 1 326 720 495 570 52 500 3 563 620
1996 1 682 370 1 434 240 516 490 54 380 3 674 950
1997 1 657 840 1 548 650 537 080 56 380 3 787 500
1998 1 633 800 1 648 530 557 300 55 300 3 882 500
1999 1 627 420 1 772 950 593 250 59 920 4 041 120
2000 1 609 650 1 916 580 633 910 67 780 4 215 600
2001 1 596 230 2 073 510 683 220 77 760 4 418 370
2002 1 566 200 2 203 480 721 040 83 420 4 561 920
2003 1 546 200 2 325 670 758 400 86 690 4 704 830
2004 1 530 160 2 456 610 800 550 89 240 4 864 500
2005 1 504 970 2 572 530 834 490 95 940 4 996 040
2006 1 487 250 2 721 690 892 040 100 380 5 189 530
2007 1 468 380 2 845 070 961 370 113 150 5 376 270
2008 1 448 110 2 969 850 1 040 450 135 770 5 582 620
2009 1 427 680 3 085 060 1 108 540 144 990 5 754 820
2010 1 402 860 3 210 730 1 167 500 152 860 5 922 630
2011 1 383 820 3 341 160 1 235 990 159 860 6 109 610
2012 1 357 120 3 459 270 1 309 170 169 220 6 283 720
2013 1 338 680 3 592 180 1 392 590 183 820 6 496 340
2014 1 316 980 3 711 570 1 485 520 191 870 6 695 160
2015 1 289 570 3 838 940 1 565 250 190 850 6 874 090
2016 1 261 330 3 961 000 1 659 020 198 650 7 069 640
2017 1 235 360 4 065 020 1 789 770 236 740 7 316 750
2018 1 212 000 4 206 620 1 951 600 304 340 7 664 630
2019 1 173 050 4 343 280 2 096 420 426 620 8 029 700
2020 1 150 500 4 412 810 2 146 050 463 720 8 163 570
2021 1 119 920 4 500 150 2 181 670 667 640 8 460 090
2022 1 090 390 4 664 710 2 211 500 1 148 640 9 106 130
Total des déclarants 2 065 390 5 850 820 2 456 110 2 256 120 ... n'ayant pas lieu de figurer
Total des non‑déclarants 2 049 250 1 244 600 140 590 3 867 490 ... n'ayant pas lieu de figurer
pourcentage
Pourcentage de déclarants 50,2 82,5 94,6 36,8 ... n'ayant pas lieu de figurer

Le graphique 7 montre que la proportion des résidents permanents qui étaient résidents non permanents avant leur admission, par année, varie de 22,7 %, le plus bas niveau pour l’année d’imposition 1983, à 32,7 %, niveau le plus élevé correspondant à l’année d’imposition de 2020.

Graphique 7 Pourcentage de résidents permanents qui étaient résidents non permanents avant leur admission, par année d'imposition

Tableau de données du graphique 7
Tableau de données du graphique 7 Sommaire du tableau
Le tableau montre les résultats de . Les données sont présentées selon Année d'imposition (titres de rangée) et , calculées selon (figurant comme en-tête de colonne).
Année d'imposition pourcentage
Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2023.
1982 22,9
1983 22,7
1984 23,4
1985 24,3
1986 26,1
1987 27,7
1988 28,3
1989 29,8
1990 29,6
1991 30,0
1992 29,9
1993 28,9
1994 27,9
1995 27,2
1996 26,5
1997 25,8
1998 25,3
1999 25,1
2000 24,9
2001 24,8
2002 24,7
2003 24,6
2004 24,6
2005 24,5
2006 24,7
2007 25,3
2008 25,9
2009 26,4
2010 26,7
2011 27,0
2012 27,5
2013 27,9
2014 28,6
2015 29,0
2016 29,5
2017 30,6
2018 31,7
2019 32,6
2020 32,7
2021 32,7
2022 32,2

Un immigrant qui produit une déclaration de revenus pour une année donnée n’en produira pas nécessairement l’année suivante. Si une personne A, par exemple, a été admise en 1983, elle peut figurer dans les fichiers de données fiscales de 1984 à 1999, mais pas dans le fichier de 2000, et y figurer ensuite à nouveau de 2001 à 2013. Ainsi, des fichiers de données fiscales étaient disponibles tous les ans pour 24,3 % des déclarants de la cohorte de 1980. Une émigration externe, un décès ou un retard de déclaration peut expliquer, en outre, que des immigrants déclarants aient pu ne plus produire de déclaration de revenus ou ne pas en produire certaines années.

La plupart des immigrants déclarent leurs revenus pour la première fois l’année de leur admission ou l’année précédente ou suivante. Ainsi, sur les 251 230 immigrants admis en 2006, 100 530 (40,0 %) ont produit une déclaration de revenus pour la première fois en 2006, alors que 15 560 (6,2 %) l’ont fait en 2007 et 3 190 (1,3 %) en 2015.

7.5 Évaluation de la qualité de la données sur l’immigration

7.5.1 Évaluation de la qualité du Fichier intégré des résidents permanents et non permanents (FRPN)

Le contenu du FRPN (PNRF_1980_2023) a été évalué. Alors que la collecte des données fiscales et relatives à l’admission est obligatoire pour les personnes dans le champ d’enquête, ces dernières peuvent ne pas remplir tous les champs. Ces champs ont pu être laissés vides parce que le répondant ne connaissait pas la réponse ou pour d’autres raisons, que les utilisateurs des données ne peuvent connaître (p. ex. refus) (McLeish, 2011). L’absence de réponse à certaines questions peut présenter des problèmes lorsque la BDIM est utilisée à des fins statistiques, notamment dans les cas suivants :

  1. Si l’utilisateur de la base de données souhaite produire un échantillon fondé sur les caractéristiques pour lesquelles des enregistrements manquent, une erreur de couverture peut survenir (c.-à-d. les personnes incluses dans la base d’échantillon peuvent ne pas être représentatives de la population cible).
  2. S’il s’agit d’une absence de données informatives (p. ex. l’absence du renseignement n’est pas un cas aléatoire; l’absence de réponse indique ce que la réponse aurait été), toute analyse utilisant ces variables serait biaisée.

On a évalué la présence de variables manquantes et de valeurs non valides. Les chiffres présentés dans cette section sont arrondis. Les valeurs non valides sont soit incohérentes soit elles ne figurent pas dans les tableaux de métadonnées à la disposition des utilisateurs (voir la composante sur l’immigration du dictionnaire de données en annexe). La plupart des problèmes de qualité figurant dans le tableau 8 concernent des données recueillies dans les années 1980 et 1990. Il convient de souligner que des valeurs semblant valides peuvent également être erronées.

La variable de numéro d’identification du cas (CASE_ID) présente des taux de réponse aux éléments se situant généralement dans la frange supérieure des 90 % (généralement plus de 99 %). Cependant, pour certaines années d’admission, le taux de réponse diminue significativement (jusqu’à 80 % en 1991 et 1992). Par conséquent, toute analyse fondée sur cette variable pour toutes les années d’admission sous-représentera ces années, pour lesquelles le manque de réponse à l’élément est plus élevé (p. ex. 1986, 1987, 1991, 1992, 1993, 2020). Aucune détection des valeurs non valides n’a eu lieu pour la variable de numéro d’identification du cas (CASE_ID).

La variable d’âge à l’admission Landing_age est définie comme non valide lorsqu’elle dépasse 100, même s’il est possible dans certains cas que ces valeurs soient exactes. Il convient de souligner que, selon les valeurs de cette variable, le nombre d’immigrants admis après l’âge de 100 ans était bien plus élevé entre 1987 et 1995 que pour les autres années d’admission. Il pourrait s’agir d’un problème de saisie de données.

Dans le FRPN de la BDIM de 2023, 25 enregistrements présentaient une année de naissance antérieure à 1880 et 15 avaient une année de naissance de 1753 avec une année d’admission après 1985.

Les variables relatives au pays présentent également des problèmes de qualité. Le pays de naissance manque dans certains enregistrements pour pratiquement toutes les années d’admission. Des valeurs manquent, par exemple, pour plus de 100 enregistrements dans chacune des années de 1985 à 1993. Le pays de citoyenneté est manquant pour moins de 20 enregistrements par année d’admission pour la plupart des cohortes (à l’exception des cohortes de 2004, 2005, 2006 et 2007, où plus de 100 valeurs étaient manquantes par année d’admission). Le pays de résidence manque pour de nombreux enregistrements d’admission pour 2011 (cette valeur manque pour 1 810 enregistrements, soit 0,7 % des admissions de cette année‑là), pour 2012 (cette valeur manque pour 5 015 enregistrements, soit 1,9 % des admissions de cette année‑là) et pour 2013 (manquant pour 2 375 enregistrements, soit 0,9 % des admissions de cette année‑là).

Les variables de scolarité avant la cohorte de 2017, après imputation (voir la section 6.3) présentent plus de 150 valeurs manquantes par année d’admission de 1980 à 1984; cela équivaut à un taux de valeurs manquantes par année d’admission de moins de 0,5 %.  Une nouvelle variable a été dérivée en utilisant les données d’entrée express pour imputer le niveau de scolarité des personnes admises entre 2015 et 2020.

Le pourcentage de réponses valides pour les variables de profession est plus de 99 % pour toutes les années d’admission.

Les variables de statut dans la famille Family_Status et d'immigrants sélectionnés par le Québec CSQ_IND ont la plupart de leurs valeurs manquants pour les enregistrements des années d’admission antérieures à 1999.

La variable de langue maternelle Mother_Tongue manque pour quelques centaines d'enregistrements entre les années d'admission 1990 et 1995

La langue officielle Official_Language a un nombre croissant de valeurs manquantes ; 2016 à 2023, entre 1 820 et 10 815 par cohorte ont une valeur manquante.

La variable de l’état matrimonial Marital_Status a eu plus de 200 valeurs manquantes par cohorte depuis 2012.

Les variables Destination_CD, Destination_CMA, Destination_CSD et Destination_Province ont moins de valeurs manquantes dans la BDIM 2023 que lors des années précédentes suite à la mise à jour avec la Classification Géographique Type (CGT) de 2016.

Les variables d’année et de mois de décès manquent pour certaines personnes reconnues comme décédées (Death_Indicator=1). La valeur « 9999 » a été attribuée à la variable d’année de décès Death_Year et la valeur « 99 » à celle du mois de décès Death_Month dans les cas où l’année et le mois de décès étaient inconnus.

Tableau 8
Évaluation de la qualité du Fichier intégré des résidents permanents et non permanents Sommaire du tableau
Le tableau montre les résultats de Évaluation de la qualité du Fichier intégré des résidents permanents et non permanents. Les données sont présentées selon Variables du PNRF (titres de rangée) et Résponses valides , Résponses non valides et Champs vides , calculées selon pourcentage et nombre unités de mesure (figurant comme en-tête de colonne).
Variables du PNRF Résponses valides Champs vides Résponses non valides
nombre pourcentage nombre pourcentage nombre pourcentage
Notes : FRPN: Fichier intégré des résidents permanents et non permanents. RNP: Résident non permanent. Seules les variables ayant des valeurs manquantes ou invalides ont été incluses dans ce tableau. Tous les chiffres sont arrondis.
Source : Statistique Canada, Base de données longitudinales sur l’immigration 2023.
Case_ID 9 977 820 98,18 184 950 1,82 0 0,00
Landing_age 10 161 660 99,99 380 0,00 730 0,01
Birth_Year 10 162 560 100,00 180 0,00 20 0,00
Gender 10 162 770 100,00 0 0,00 0 0,00
Country_Birth 10 159 870 99,97 2 890 0,03 0 0,00
Country_Citizenship 10 161 240 99,99 1 520 0,01 0 0,00
Country_Residence 10 149 420 99,87 13 350 0,13 0 0,00
Education_Qualification 9 345 490 91,96 817 280 8,04 0 0,00
Level_of_Education 10 160 700 99,98 2 070 0,02 0 0,00
Years_of_Schooling 10 160 360 99,98 2 410 0,02 0 0,00
Education_Derived 9 720 030 95,64 442 740 4,36 0 0,00
Landing_age_6_groups 10 162 390 100,00 380 0,00 0 0,00
Landing_age_9_groups 10 162 390 100,00 380 0,00 0 0,00
Occupation_CD 10 155 210 99,93 7 560 0,07 0 0,00
NOC5-NOC2 10 106 950 99,45 55 820 0,55 0 0,00
Skill_level_CD11 10 155 200 99,93 7 560 0,07 0 0,00
Family_Status 10 160 180 99,97 2 590 0,03 0 0,00
Family_Status_rollup 10 160 180 99,97 2 590 0,03 0 0,00
Marital_status 10 157 050 99,94 5 710 0,06 0 0,00
Marital_status_rollup 10 157 050 99,94 5 710 0,06 0 0,00
Mother_Tongue 10 160 660 99,98 2 110 0,02 0 0,00
Official_Language 10 108 970 99,47 53 790 0,53 0 0,00
Special_Program 2 134 350 21,00 8 028 420 79,00 0 0,00
CSQ_ind 10 162 540 100,00 230 0,00 0 0,00
Destination_CD 10 162 430 100,00 330 0,00 0 0,00
Destination_CMA 10 162 430 100,00 330 0,00 0 0,00
Destination_CSD 10 162 430 100,00 330 0,00 0 0,00
Destination_Province 10 162 430 100,00 330 0,00 0 0,00
Permits and NPR-specific variables 2 811 780 100,00 0 0,00 0 0,00
Death_Year 10 162 130 99,99 640 0,01 0 0,00
Death_Month 10 162 100 99,99 670 0,01 0 0,00

7.5.2 Évaluation de la qualité du Fichier des résidents non permanents (FRN)

Une validation du contenu des fichiers NRF_PERMIT_1980_2023 et NRF_PERSON_1980_2023 a été effectuée. Ces fichiers contiennent des ensembles de variables différents les uns des autres. Dans le tableau 8B, les variables "Landing_Year" à "Number_All_Permits) apparaissent dans le fichier des personnes, tandis que les autres apparaissent dans le fichier des permis. Alors que la collecte des données fiscales et relatives à l’admission est obligatoire pour les personnes dans le champ d’enquête, ces dernières peuvent ne pas remplir tous les champs. Ces champs ont pu être laissés vides parce que le répondant ne connaissait pas la réponse ou pour d’autres raisons, que les utilisateurs des données ne peuvent connaître (p. ex. refus)  (McLeish 2011). L’absence de réponse à certaines questions peut présenter des problèmes lorsque la BDIM est utilisée à des fins statistiques, notamment dans les cas suivants :

  1. Si l’utilisateur de la base de données souhaite produire un échantillon fondé sur les caractéristiques pour lesquelles des enregistrements manquent, une erreur de couverture peut survenir (c.-à-d. les personnes incluses dans la base d’échantillon peuvent ne pas être représentatives de la population cible).
  2. S’il s’agit d’une absence de données informatives (p. ex. l’absence du renseignement n’est pas un cas aléatoire; l’absence de réponse indique ce que la réponse aurait été), toute analyse utilisant ces variables serait biaisée.

La présence de variables manquantes et de valeurs non valides a été évaluée. Les chiffres présentés dans cette section sont arrondis. Les valeurs non valides sont soit incohérentes, soit non répertoriées dans les tableaux de métadonnées mis à la disposition des utilisateurs (voir la composante immigration de l'annexe du dictionnaire des données). Il convient de noter que certaines valeurs apparemment valides peuvent également être erronées.

La variable Landing_year présente un pourcentage élevé de valeurs manquantes (71,9 %). Ceci est normal puisque seuls les immigrants admis ont une année d’admission et que la NRF inclut tous les résidents non permanents, qu'ils soient devenus résidents permanents ou non.

Dans le fichier NRF_PERSON de la BDIM 2023, 260 enregistrements ont une année de naissance antérieure à 1880, et 250 enregistrements ont une année de naissance antérieure à 1753.

Alors que la plupart des enregistrements ont un pays de naissance (Country_Birth), ceux dont le pays de naissance est manquant ont également une année d'admission manquante.

Les variables Effective_Date et Valid_Date n'ont pas de réponses invalides en elles-mêmes, mais lorsqu'elles sont comparées ensemble, elles peuvent produire des réponses invalides. Par exemple, la Valid_Date doit toujours arriver après la Effective_Date. Les enregistrements dont la date de validité apparaît avant la date d'entrée en vigueur peuvent être considérés comme des réponses non valides pour l'une de ces variables ou les deux. De plus, tout enregistrement dont la durée entre Effective_Date et la Valid_Date est de 5 ans ou plus peut être considéré comme suspect et comprenant probablement une valeur non valide pour une des deux variables. 0,05 % des comparaisons entre les variables Effective_Date et Valid_Date pourraient être considérées comme non valides en raison de ces deux problèmes.

Plus de 99 % des valeurs manquantes de la variable Valid_Date se produisent lorsque la variable Document_Type est 46 (demande d'asile), ce qui s'explique par le fait qu'aucune date de fin n'est attribuée aux demandes d'asile.

Les variables Destination_CD, Destination_ER, Destination_CMA, Destination_CSD et Destination_province présentent une proportion de valeurs manquantes plus faible que les autres variables, mais beaucoup plus importante que le dans le fichier PNRF. La plupart des années avant 2004 (sur la base de la variable Effective_Date) ont un taux de variables manquantes très faible, autour de 1%. Cependant, l'année 1989 a un taux de variables manquantes de près de 12 %. Après 2004, le taux manquant fluctue entre 2 % et 13 %. La BDIM 2023 utilise la Classification géographique standard (CGS) pour mettre à jour la région et le code géographiques.

Table 8B
Évaluation de la qualité des Fichiers résidents non permanents Sommaire du tableau
Le tableau montre les résultats de Évaluation de la qualité des Fichiers résidents non permanents. Les données sont présentées selon Variables du NRF (titres de rangée) et Résponses non valides, Champs vides et Résponses valides , calculées selon nombre et pourcentage unités de mesure (figurant comme en-tête de colonne).
Variables du NRF Résponses valides Champs vides Résponses non valides
nombre pourcentage nombre pourcentage nombre pourcentage
Notes : NPR : résident non permanent. Seules les variables dont les valeurs sont manquantes ou invalides ont été incluses dans le tableau. Tous les chiffres sont arrondis. Les variables Effective_Date et Valid_Date peuvent être invalides lorsqu'elles sont comparées entre elles. Voir le paragraphe de la section 7.5.2 pour plus de détails.
Source : Statistique Canada, Base de données longitudinales sur l’immigration 2023.
Landing Year 2 811 780 28,06 7 208 550 71,94 0 0,00
birth_year 10 018 750 99,98 1 320 0,01 260 0,00
birth_month 10 018 960 99,99 1 370 0,01 0 0,00
gender 10 020 330 100,00 0 0,00 0 0,00
COUNTRY_BIRTH 10 002 430 99,82 17 900 0,18 0 0,00
NUMBER_OTHER_PERMITS 10 020 330 100,00 0 0,00 0 0,00
NUMBER_REFUGEE_CLAIMS 10 020 330 100,00 0 0,00 0 0,00
NUMBER_WORK_PERMITS 10 020 330 100,00 0 0,00 0 0,00
NUMBER_STUDY_PERMITS 10 020 330 100,00 0 0,00 0 0,00
NUMBER_ALL_PERMITS 10 020 330 100,00 0 0,00 0 0,00
COUNTRY_RESIDENCE 22 701 430 95,92 965 120 0,04 0 0,00
COUNTRY_CITIZENSHIP 23 621 280 99,81 45 260 0,00 0 0,00
LEVEL_OF_STUDY_ROLLUP 8 449 140 35,70 15 217 410 64,30 0 0,00
LEVEL_OF_STUDY 8 449 140 35,70 15 217 410 64,30 0 0,00
SKILL_LEVEL_CD11 15 390 590 65,03 8 275 950 34,97 0 0,00
OCCUPATION_CD 15 395 250 65,05 8 271 300 34,95 0 0,00
NOC5_CD11 15 982 670 67,53 7 683 880 32,47 0 0,00
NOC4_CD11 15 982 670 67,53 7 683 880 32,47 0 0,00
NOC3_CD11 15 982 670 67,53 7 683 880 32,47 0 0,00
NOC2_CD11 15 982 670 67,53 7 683 880 32,47 0 0,00
DESTINATION_CSD 22 437 170 94,81 1 229 380 5,19 0 0,00
DESTINATION_CMA 22 437 170 94,81 1 229 380 5,19 0 0,00
DESTINATION_PROVINCE 22 437 170 94,81 1 229 380 5,19 0 0,00
DESTINATION_CD 22 437 170 94,81 1 229 380 5,19 0 0,00
DESTINATION_ER 22 437 170 94,81 1 229 380 5,19 0 0,00
effective_date 23 666 550 100,00 0 0,00 0 0,00
valid_date 22 472 570 94,95 1 193 980 5,05 0 0,00
DOCUMENT_TYPE 23 666 550 100,00 0 0,00 0 0,00
SPECIAL_PROGRAM 4 923 120 20,80 18 743 430 79,20 0 0,00
CLASSIFICATION_ID 9 235 330 39,02 14 431 210 60,98 0 0,00
LMIA_EXEMPTIONS 10 297 280 43,51 13 369 270 56,49 0 0,00

7.6 Évaluation de la qualité de la variable de la province de résidence (PRCO_)

Une validation des variables géographiques incluses dans les fichiers fiscaux de la BDIM a été effectuée. Cette section explique comment la variable Province de résidence (PRCO_) a été dérivée et sa qualité.

La province de résidence (PRCO_) est fondée sur les renseignements fournis par les déclarants, lorsque disponible. Les renseignements manquants pour la province de résidence sont remplacés par les renseignements recueillis sur le code postal de l'adresse postale de l’individu (PSCO_I), si disponible, sinon celui de la famille est utilisé (PSCO_F).

Tableau 9
Concordance entre le PRCO et le PSCO__ Sommaire du tableau
Le tableau montre les résultats de Concordance entre le PRCO et le PSCO__. Les données sont présentées selon PRCO (titres de rangée) et , calculées selon (figurant comme en-tête de colonne).
PRCO Province et Territoires Premier caractère du code postal (PSCO)
Note: Les valeurs de certain codes postales sont U ou F pour les valeurs manquantes, respectivement États‑Unis est U et, étranger est marqué par F.
0 Terre‑Neuve‑et‑Labrador A
2 Île‑du‑Prince‑Édouard B
1 Nouvelle‑Écosse C
3 Nouveau‑Brunswick E
4 Québec G, H, J
5 Ontario K, L, M, N ,P
6 Manitoba R
7 Saskatchewan S
8 Alberta T
9 Colombie‑Britannique V
10 Territoires du Nord‑Ouest X
11 Yukon Y
12 Non‑résidents manquant manquant
14 Nunavut X

Bien que la province de résidence (PRCO_) soit plus fiable que la province d’imposition (TXPCO_), certaines anomalies ont été observées principalement sur le code des non-résidents dans les déclarations des années d’imposition 1989, 1993 et 1998. Celles-ci peuvent avoir une incidence sur certaines provinces.

Pour l’année d’imposition 1993,  la IMDB_T1FF comprend des anomalies pour la province du Manitoba qui compte un nombre inhabituel de résidents (48 130 en 1993, comparativement à 33 650 l'année d'imposition précédente et à 37 365 l'année d'imposition suivante). Des changements semblables sont observés dans les Territoires du Nord-Ouest. De plus, 740 personnes sont codées comme résidant au Nunavut alors que le Nunavut a été créé en 1998. 725 personnes sont codées comme résidant dans plusieurs juridictions. Les utilisateurs peuvent utiliser l'information de la variable PSCO_F pour diminuer l'effet des anomalies sur leurs analyses qui incluent la province de résidence. Toutefois, comme nous l'avons indiqué plus haut, le moment est différent entre PSCO (basé sur le lieu de résidence lors de la transmission de la déclaration) et PRCO_ (lieu de résidence au 31 décembre).

Les enregistrements des non-résidents (PRCO_=12) semblent surestimés dans le fichier IMDB_T1FF de 1989. Il comprend 79 210 non-résidents du Canada, dont bon nombre ont un statut de résident non permanent. Les utilisateurs peuvent décider d'utiliser le code postal de l'adresse postale (PSCO_ au niveau individuel ou familial) pour calculer la valeur du PRCO_ ou retirer les non-résidents de leur analyse.

Dans le fichier FFT1 de la BDIM de 1998, IMDB_T1FF_1998, un nombre plus élevé que prévu d'enregistrements est attribué à Terre-Neuve-et-Labrador (PRCO_). Dans ces cas, le lieu de résidence de la famille au moment du dépôt de la demande est également Terre-Neuve selon la variable PSCO_F.


Date de modification :