Base de données longitudinales sur l’immigration (BDIM) Rapport technique, 2024
7 Évaluation des données et indicateurs de qualité

Passer au texte

Début du texte

7.1 Sources d’erreurs

Parce que la BDIM est produite à partir de plusieurs couplages d’enregistrements, elle comprend différentes sources d’erreurs, notamment des erreurs de couplage d’enregistrements, de mesure et de couverture. Nous expliquons, dans cette section, les sources d’erreurs et indiquerons l’importance de certaines d’entre elles.

Il convient de noter que, puisqu’il s’agit du recensement des immigrants déclarants admis depuis 1980, aucune pondération n’a été créée au sein de la BDIM. Aucune rectification n’est apportée aux années d’imposition manquantes ni aux erreurs de couplage, aucun échantillonnage n’a lieu et tous les déclarants couplés sont conservés dans l’ensemble de données final. Cependant, le couplage lui-même présente une forme d’erreur d’échantillonnage dans le cas d’échecs de couplage.

7.1.1 Erreurs de couplage d’enregistrements

Les ensembles de données produits à partir des résultats des couplages d’enregistrements peuvent comprendre des erreurs de couplage d’enregistrements. Deux types d’erreurs sont ainsi possibles : des faux positifs (fausses correspondances) et des faux négatifs (fausses non correspondances). Un couplage est un faux positif lorsque deux enregistrements ne concernant pas la même personne sont comptés comme une correspondance. Un couplage est un faux négatif lorsque deux enregistrements concernant la même personne sont comptés comme une non correspondance.

Il est possible de manquer une partie de l’historique d’un immigrant, puisque certains possèdent plusieurs numéros d’assurance sociale (NAS) au cours du temps (NAS temporaire attribué à l’admission au résident non permanent, puis NAS permanent attribué après l’admission). Ces deux NAS sont nécessaires pour constituer l’historique fiscal complet depuis l’admission de la personne au Canada. Le FCC et l’ECDS (décrit à la section 2.3) permettent de recenser ces deux NAS. Il est possible que, dans quelques cas, des liens entre les NAS échouent ou que des liens erronés soient créés.

7.1.2 Erreurs de mesure

Une erreur de mesure est la différence entre la valeur mesurée d’une variable et sa valeur réelle. On peut attribuer ce type d’erreur à plusieurs facteurs, notamment la saisie de données (p. ex. coquilles) et les erreurs des répondants (p. ex. mauvaise interprétation de la question posée). On a tenu compte de ce type d’erreur lors de la création du Fichier intégré des résidents permanents et non permanents (FRPN) pour éviter les renseignements contradictoires pour toute personne. Lorsqu’un enregistrement existe pour une personne dans le FIR et dans le FRN, par exemple, et que les variables sociodémographiques présentent des valeurs incohérentes, les valeurs à l’admission (celles du FIR) sont conservées. Voir les sections 7.2 et 7.5 qui fournissent certains chiffres.

7.1.3 Erreurs de couverture

Les erreurs de couverture proviennent d’omissions, de l’inclusion d’unités erronées, d’enregistrements en double et d’erreurs de classification d’enregistrements dans la base de données. Ces erreurs de couverture peuvent provenir d’une couverture inadéquate de la population. Elles peuvent se traduire par des estimations biaisées et les répercussions peuvent varier pour différents sous-groupes de la population. Ces erreurs entraînent souvent un sous-dénombrement. Le sous-dénombrement dans le cadre de la BDIM provient en partie de l’exclusion de la base de données des fichiers de données fiscales d’immigrants déclarants. Aucun enregistrement ne figure dans le fichier IMDB_T1FF pour les immigrants qui ne produisent pas de déclaration de revenus pour une année donnée ou qui le font en retard, même s’ils sont couplés aux données fiscales et font partie de la population d’intérêt. Si, pour une raison quelconque, l’enregistrement d’un immigrant n’est pas inclus dans le Fichier des immigrants reçus (FIR), il ne fera pas partie de la BDIM. Un surdénombrement survient lors de l’ajout à la base de données d’enregistrements exclus de la population cible. Un immigrant peut faire l’objet de plusieurs enregistrements dans le FIR du fait de plusieurs admissions non reconnues comme telles, par exemple. Veuillez-vous reporter à la section 7.4 et à l’annexe B pour de plus amples détails relatifs à la couverture de la BDIM.

7.2 Exactitude des données

Cette section porte sur l’exactitude des données relatives à l’immigration. Pour de plus amples détails sur l’exactitude du FFT1, veuillez-vous reporter au document sur le FFT1 (numéro d’enregistrement 4105).

L’exactitude de la BDIM dépend de la représentativité de la population qui y est incluse. Une étude menée au cours des premières années de la BDIM a conclu que cette dernière « semble être représentative de la population la plus susceptible de produire des déclarations de revenus. Par conséquent, les résultats obtenus à partir de la BDIM ne devraient pas être appliqués à la population immigrante dans son ensemble, mais plutôt à l’univers des immigrants qui produisent des déclarations de revenus » (Carpentier et Pinsonneault, 1994).

Les raisons expliquant les différences entre les déclarants et la population totale des personnes nées à l’étranger sont expliquées dans un article de Badets et Langlois (2000) décrivant les défis d’utilisation de la BDIM :

Les caractéristiques de la population immigrante qui produit des déclarations de revenus diffèrent de celles de l’ensemble de la population née à l’étranger, étant donné que la probabilité ou la nécessité de produire une déclaration de revenus varie selon l’âge, la situation familiale de la personne et d’autres facteurs. On pourrait s’attendre à ce qu’un pourcentage plus élevé d’immigrants de sexe masculin produisent une déclaration de revenus, notamment parce qu’ils ont des taux de participation au marché du travail plus élevés que les femmes. Le niveau de « saisie » des immigrants dans la BDIM est aussi influencé par les changements touchant l’impôt sur le revenu. Par exemple, la mise en place de programmes de crédits d’impôt non remboursables à l’échelle fédérale et provinciale incite les personnes qui n’ont pas de revenus imposables à produire une déclaration de revenus pour être admissibles à certains crédits d’impôt.

Ces commentaires sur la représentativité de la BDIM s’appliquent toujours.

7.2.1 BDIM de 2023: Taux de couplage

Cette section porte sur la BDIM de 2024. Le taux global de couplage entre les données d'immigration d'IRCC et le Dépôt d’enregistrements dérivés de l’ECDS était de 97,1 % (voir section 4). Un lien ne signifie pas nécessairement qu'une déclaration fiscale est disponible puisqu'il est possible de coupler les personnes à charge des déclarants ou des immigrants qui n'ont pas encore produit leur déclaration de revenus. Ce taux de couplage théorique informe principalement sur la façon dont les fichiers d’IRCC pourraient être associés dans un environnement référentiel plus large.

Parmi les immigrants admis entre 1980 et 2024, 85,6 % étaient liés à au moins un FFT1. Ce taux représente la couverture effective du couplage entre les déclarations fiscales et les fichiers d'immigration. Tel que présenté dans les statistiques suivantes, ce taux de couverture peut varier selon le sexe et l'âge.

La proportion de déclarants couplés selon le groupe d'âge au moment de l'admission et le sexe est indiquée au tableau 4. On s'attend à ce que les taux plus faibles pour le groupe d'âge de 0 à 14 ans soient observés puisque les personnes de ce groupe d'âge ne sont pas en âge de travailler. Voir l'annexe B pour les taux selon le sexe, le groupe d'âge et la cohorte d'admission.

Tableau 4
Proportion de déclarants couplés, par tranche d’âge à l’admission et par sexe Sommaire du tableau
Le tableau montre les résultats de Proportion de déclarants couplés, par tranche d’âge à l’admission et par sexe Âge à l’admission, 0 à 14 ans, 15 à 24 ans , 25 à 34 ans, 35 à 49 ans, 50 à 64 ans, 65 ans et plus et Total, calculées selon pourcentage unités de mesure (figurant comme en-tête de colonne).
  Âge à l’admission
0 à 14 ans 15 à 24 ans 25 à 34 ans 35 à 49 ans 50 à 64 ans 65 ans et plus Total
pourcentage
Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2024.
Hommes 57,4 89,9 91,9 91,6 87,7 74,7 83,4
Femmes 56,6 89,2 91,2 92,1 85,7 73,6 83,3
Total 57,0 89,5 91,5 91,8 86,6 74,1 83,4

À mesure que les immigrants vieillissent, ils commencent à produire des déclarations de revenus et sont inclus dans la BDIM. Le graphique 1 montre que, parmi les immigrants admis à tout âge de 0 à 14 ans, la proportion de déclarants couplés est supérieure pour les immigrants admis avant 2000 que pour ceux admis depuis 2000. Les immigrants récents ont des taux de couplage inférieurs. Voir l’annexe B pour un tableau présentant la proportion de déclarants couplés par groupe d’âge à l’admission, sexe et décennie d’admission.

Graphique 1 Proportion de déclarants couplés, par tranche d'âge à l'admission et décennie d'admission

Tableau de données du graphique 1
Tableau de données du graphique 1 Sommaire du tableau
Les données sont présentées selon Cohortes (titres de rangée) et Tranche d'âge, 0 à 14 ans, 15 à 24 ans , 25 à 34 ans, 35 à 49 ans, 50 à 64 ans et 65 ans et plus, calculées selon proportion unités de mesure (figurant comme en-tête de colonne).
Cohortes Tranche d'âge
0 à 14 ans 15 à 24 ans 25 à 34 ans 35 à 49 ans 50 à 64 ans 65 ans et plus
proportion
Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2024.
Cohortes de 1980 à 1989 0,82 0,93 0,94 0,93 0,83 0,61
Cohortes de 1990 à 1999 0,81 0,92 0,93 0,93 0,89 0,76
Cohortes de 2000 à 2009 0,80 0,93 0,92 0,93 0,93 0,88
Cohortes de 2010 à 2019 0,37 0,96 0,96 0,95 0,93 0,86
Cohortes de 2020 à 2023 0,02 0,82 0,92 0,93 0,81 0,70

Le graphique 2 illustre la proportion de déclarants ainsi que le nombre de déclarants et de non-déclarants par année d’admission; la mention « non déclarant » indique qu’aucun enregistrement dans le FFT1 n’est disponible. Dans la BDIM de 2024, le taux de déclaration varie en fonction de l’année d’admission, de 67,3 % pour les personnes admises en 2023 à 91,3 % pour celles admises en 1989. Le taux de déclaration augmente à mesure du nombre d’années de présence des immigrants au Canada; cela peut expliquer pourquoi les taux de couplage sont supérieurs pour les immigrants admis dans les années 1990 et le début des années 2000. Voir l’annexe B, tableaux 14 et 15, pour connaître des chiffres de répartition détaillés par année d’admission.

Graphique 2 Répartition des déclarants et des non-déclarants par année d'admission

Tableau de données du graphique 2
Tableau de données du graphique 2 Sommaire du tableau
Les données sont présentées selon Année d'admission (titres de rangée) et Déclarants, Non-déclarants et Taux, calculées selon nombre d'immigrants et pourcentage unités de mesure (figurant comme en-tête de colonne).
Année d'admission Déclarants Non-déclarants Taux
nombre d'immigrants pourcentage
Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2024.
1980 120 470 22 530 84,2
1981 107 740 20 730 83,9
1982 103 440 17 520 85,5
1983 77 140 11 820 86,7
1984 77 520 10 430 88,1
1985 75 110 8 780 89,5
1986 89 140 9 540 90,3
1987 137 660 13 340 91,2
1988 146 260 14 240 91,1
1989 173 890 16 490 91,3
1990 192 200 22 850 89,4
1991 208 620 22 800 90,1
1992 228 730 24 780 90,2
1993 230 760 24 360 90,5
1994 198 580 24 360 89,1
1995 188 620 22 920 89,2
1996 198 370 26 170 88,3
1997 189 190 25 440 88,1
1998 155 380 17 770 89,7
1999 168 910 19 910 89,5
2000 203 760 22 300 90,1
2001 225 000 23 870 90,4
2002 204 920 22 380 90,2
2003 198 130 21 450 90,2
2004 212 770 22 580 90,4
2005 235 630 26 060 90,0
2006 226 760 24 350 90,3
2007 212 760 23 560 90,0
2008 219 500 27 190 89,0
2009 224 010 27 730 89,0
2010 244 740 35 350 87,4
2011 214 090 33 920 86,3
2012 221 470 35 430 86,2
2013 220 850 37 350 85,5
2014 223 030 36 750 85,9
2015 229 130 42 100 84,5
2016 239 450 56 090 81,0
2017 236 450 48 720 82,9
2018 255 880 63 550 80,1
2019 265 810 73 740 78,3
2020 146 940 36 690 80,0
2021 332 060 71 930 82,2
2022 312 040 123 410 71,7
2023 316 020 153 480 67,3

7.2.2 Disponibilité de la date de décès

L’année et le mois d’un décès, ainsi que l’indicateur de décès, sont inclus dans le FRPN.  Dans la BDIM de 2021, ces variables ont été couplées à l'aide de la Base canadienne de données sur la mortalité (BCDM). Dans le passé, ces variables étaient fondées sur la Base de mortalité amalgamée (BMA) de Statistique Canada, qui est un ensemble de données archivé qui combine des enregistrements entre la BCDM, les statistiques de l'état civil, et des fichiers fiscaux. La BCDM est une base de données administratives qui recueille des renseignements sur les dates et les causes de décès dans tous les registres provinciaux et territoriaux de l'état civil au Canada. Un certain sous-dénombrement, bien que minime, existe dans la base de données, car il ne comprend pas les décès de Canadiens (1) qui sont morts à l'extérieur du Canada, à l'exception des États-Unis ; (2) qui ont servi comme membres des Forces canadiennes, ou (3) dont les corps n'ont pas été identifiés. Il est à noter que la BCDM ne comprend pas les décès qui ont été déclarés dans les dossiers fiscaux.

Le graphique 3 décrit la tendance générale du nombre de décès par an depuis 1974 pour les immigrants arrivés depuis 1952. Les données antérieures à 1980 ont été ajoutées récemment à la BDIM. La valeur « 9999 » représente les enregistrements d’immigrants décédés pour lesquels l’année de décès n’est pas disponible.

Graphique 3 Résidents permanents et non permanents par année de décès

Tableau de données du graphique 3
Tableau de données du graphique 3 Sommaire du tableau
Les données sont présentées selon Année de décès (titres de rangée) et Résidents permanents entre 1952 et 1979 et Résidents permanents depuis 1980, calculées selon nombre de décès unités de mesure (figurant comme en-tête de colonne).
Année de décès Résidents permanents entre 1952 et 1979 Résidents permanents depuis 1980
nombre de décès
Note .

indisponible pour toute période de référence

Note : La valeur 9999 a été utilisée lorsque la date de décès n'était pas disponible.
Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2024.
1974 4 840 . indisponible pour toute période de référence
1975 5 270 . indisponible pour toute période de référence
1976 5 580 . indisponible pour toute période de référence
1977 6 220 . indisponible pour toute période de référence
1978 6 530 . indisponible pour toute période de référence
1979 7 090 . indisponible pour toute période de référence
1980 7 700 90
1981 7 620 300
1982 7 940 510
1983 8 510 740
1984 8 920 950
1985 9 350 1 110
1986 10 060 1 340
1987 10 420 1 630
1988 11 040 1 900
1989 11 490 2 210
1990 11 790 2 450
1991 12 570 2 910
1992 13 130 3 210
1993 13 900 3 740
1994 14 390 4 280
1995 15 170 4 730
1996 15 610 5 120
1997 16 040 5 440
1998 16 610 5 760
1999 17 370 6 180
2000 17 390 6 400
2001 17 840 6 930
2002 18 560 7 320
2003 19 030 8 100
2004 19 250 8 280
2005 19 990 8 650
2006 20 230 9 140
2007 21 160 9 850
2008 21 690 10 280
2009 22 210 10 760
2010 22 560 11 120
2011 22 820 11 920
2012 23 390 12 180
2013 24 680 13 190
2014 25 220 14 100
2015 26 110 15 010
2016 26 730 15 850
2017 27 550 17 200
2018 27 860 18 130
2019 28 000 19 040
2020 31 180 23 350
2021 30 590 24 660
2022 32 250 25 690
2023 31 370 24 700

7.2.3 Déclarants avant l’admission par rapport aux enregistrements du Fichier des résidents non permanents (FRN)

Les résultats inclus dans cette section sont tirés d’une étude fondée sur la BDIM de 2014. Les déclarants avant l’admission sont des immigrants qui ont produit une déclaration de revenus avant leur année d’admission. Il est parfois déduit que tous les déclarants avant l’admission sont des immigrants qui étaient des résidents non permanents avant leur admission. Cette section explique pourquoi ce n’est pas le cas. Au total, 1,26 million de personnes ont produit une déclaration de revenus avant leur admission officielle depuis 1980; sur ce total, 212 500 ne sont pas couplées à un enregistrement de résident non permanent, contrairement à ce à quoi l’on pourrait s’attendre. Après une enquête approfondie, on a découvert que la plupart des déclarants avant l’admission qui étaient des résidents permanents non couplés à un enregistrement de résident non permanent étaient probablement des immigrants ayant produit une déclaration de revenus lorsque cela n’était pas requis : 96 % de ces déclarants avant l’admission ont uniquement produit une déclaration de revenus pour l’année précédant leur année d’admission et 75 % n’ont déclaré aucun revenu (96 % n’avaient aucun salaire). Comme le montre le graphique 4, la plupart de ces déclarants avant l’admission ont été admis au cours des premiers mois de l’année, avant la date d’échéance de la production d’une déclaration de revenus pour l’année précédente. Il semble que certains immigrants admis avant le mois de mai ont produit une déclaration de revenus pour l’année précédant leur année d’admission; ce qu’ils n’étaient pas tenus de faire.

Selon ces résultats, il est justifié de supprimer les enregistrements présentant les variables de déclarant avant l’admission Prefiler_ind=1 et FIRST_EFFECTIVE_YEAR=. des études sur les immigrants ayant une expérience avant leur admission dépend de l’analyse, puisque FIRST_EFFECTIVE_YEAR=. signifie qu’aucun enregistrement ne figure dans le fichier de permis de résidents non permanents.

Graphique 4 Réparatition des déclarants avant l'admission sans permis de résidence non permanente, par mois d'admission

Tableau de données du graphique 4
Tableau de données du graphique 4 Sommaire du tableau
Les données sont présentées selon Mois d'admission (titres de rangée) et , calculées selon (figurant comme en-tête de colonne).
Mois d'admission Nombre d'immigrants
Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2014.
janvier 32 300
février 36 100
mars 35 500
avril 24 100
mai 20 500
juin 18 200
juillet 16 100
août 11 200
septembre 9 800
octobre 5 500
novembre 2 000
décembre 1 200

Tous les immigrants ayant une expérience avant leur admission ne sont pas considérés comme étant des déclarants avant l’admission : 478 100 immigrants disposent d’enregistrements de résidents non permanents avec la variable Prefiler_ind=0. En fonction du sujet étudié, utiliser la variable FIRST_EFFECTIVE_YEAR<>. ou le nombre de permis de résidence temporaire (variable NUMBER_ALL_PERMITS) est plus approprié pour étudier les immigrants ayant une expérience avant leur admission. La variable Prefiler_ind=0 indique qu’aucune déclaration de revenus n’a été produite avant l’admission, mais elle ne signifie pas que la personne n’a pas d’expérience au Canada avant son admission.

7.2.4 Indicateur de conjoint

La BDIM contient des variables permettant aux utilisateurs de données d’obtenir des renseignements sur l’état matrimonial et les conjoints. La section suivante présente les résultats d’une étude menée sur la BDIM de 2012. Aucune modification majeure n’a été apportée depuis aux codes d’état matrimonial ni à l’indicateur relatif à la famille.

L’identificateur de conjoint (SP__IDI) est dérivé des fichiers de données fiscales. Ce renseignement peut uniquement être dérivé lorsque le répondant déclare son conjoint ou sa conjointe lors de sa déclaration de revenus; cela entraîne une sous-estimation des couples par rapport à l’état matrimonial déclaré dans les fichiers de données fiscales. Il est également possible à partir du FFT1 d’obtenir l’état matrimonial au moment de la déclaration.

Avant 1991, la catégorie « célibataire » n’était pas proposée comme état matrimonial (MSTCO). La catégorie « conjoint de fait » est disponible depuis 1992 pour tous les ensembles de données (1982 à 2012). Depuis 1992, la proportion des enregistrements de la BDIM indiquant un état matrimonial « célibataire » varie entre 20 % et 30 %. La proportion de personnes « séparées » a diminué, passant de 30 % avant 1992 à 4 % par la suite. Des modifications de tendance n’ont pas influé sur les autres catégories d’état matrimonial.

Une analyse portant sur la répartition de l’état matrimonial (MSTCO des fichiers de données fiscales) et l’identificateur de conjoint (SP__IDI) a révélé des différences entre ces deux variables. Ces différences sont dues à l’absence de valeurs d’état matrimonial dans certains enregistrements. Dans une situation parfaite, les enregistrements de toutes les personnes mariées présenteraient des renseignements sur le conjoint et ceux de toutes les personnes célibataires n’en indiqueraient pas. L’analyse effectuée a indiqué que la qualité des données s’était améliorée après 1992, lorsque les états matrimoniaux distincts « conjoint de fait » et « célibataire » ont été introduits.

Lacunes d’indication de conjoint

À la suite d’un examen de l’historique longitudinal des immigrants sur la BDIM de 2012, on a relevé des cas où le conjoint ou conjoint de fait manquait (ou différait) pour une année donnée et où le même conjoint était déclaré deux ou trois ans plus tard. Le graphique 5 fournit un résumé de ces lacunes.

Graphique 5 Proportion des cas présentant un identificateur de conjoint (SP_IDI) incohérent, par année d'admission

Tableau de données du graphique 5
Tableau de données du graphique 5 Sommaire du tableau
Les données sont présentées selon Année d'admission (titres de rangée) et , calculées selon (figurant comme en-tête de colonne).
Année d'admission Pourcentage
Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2012.
1980 16,8
1981 16,6
1982 17,1
1983 17,7
1984 17,4
1985 17,7
1986 17,7
1987 16,9
1988 14,4
1989 13,9
1990 13,4
1991 14,4
1992 13,5
1993 12,7
1994 9,8
1995 9,4
1996 8,7
1997 8,1
1998 7,8
1999 7,1
2000 6,3
2001 5,6
2002 5,0
2003 4,6
2004 4,0
2005 3,1
2006 2,9
2007 2,4
2008 1,8
2009 1,1
2010 0,7
2011 0,5

La plupart des immigrants du fichier ont un conjoint ou non entre 1980 et 2012 selon les fichiers IMDB_T1FF. Il faut souligner qu’aucun état matrimonial (et aucun renseignement sur le conjoint) n’est disponible pour 1,2 million d’immigrants sur environ 6 millions d’immigrants.

7.3 Variables imputées

7.3.1 Imputation des variables relatives à la scolarité

Un problème de qualité des données a en outre été relevé quant aux variables relatives au niveau de scolarité et aux années d’études. Une proportion non négligeable de personnes n’ayant pas déclaré leur niveau de scolarité ou d’années d’études ont reçu le code « 0 » soit « aucun » plutôt que « manquant » pour les variables EDUCATION_QUALIFICATIONS et YEARS_OF_SCHOOLING. Ce problème est devenu courant de 2011 à 2014. En 2011, 35 % des immigrants ont indiqué ne pas avoir suivi d’études, par rapport à environ 10 % dans les années 1990.

Ce problème a été résolu en imputant des variables de scolarité à partir des moyennes des valeurs des variables de scolarité de 2008 à 2010, pour refléter les variables de scolarité de l’année la plus récente. Pour cette imputation, on a utilisé des variables telles que l’âge à l’admission, le groupement de catégories d’immigration 2, la profession envisagée, le sexe et le pays de dernière résidence. La méthodologie d’imputation du plus proche voisin a été employée. La variable d’imputation de la scolarité Education_imputation_ind (0: non; 1: oui), disponible dans le FRPN, a été créée pour déterminer les enregistrements au sein desquels les variables de scolarité ont été imputées.

Pour les immigrants admis en 2016, le nombre de cas où une scolarité non-déclarée a reçu le code « 0 » ou « aucun » plutôt que « manquant » a été réduit. Cependant, un nombre non négligeable d’enregistrements avait un niveau de scolarité manquant avec des années d’études valides. Pour ces enregistrements, les années d’études ont été utilisées pour imputer une valeur pour le niveau de scolarité.

Pour les demandeurs principaux admis depuis 2015, sous le processus d’entrée express,  les années de scolarisation sont sous-estimées.

Pour la BDIM 2024, les personnes admises entre 2015 et 2024 qui ont été connectées au dossier Express Entry ont vu leur éducation imputée en utilisant les valeurs trouvées dans le fichier Express Entry. Une variable d’éducation plus complète, Education_Derived, a été créée, combinant les données de Educatoin_Qualification pour ceux qui n’ont pas été trouvés dans le fichier Express Entry, et les nouvelle valeurs provenant de Express Entry.

Les utilisateurs devraient noter que les valeurs du fichier d’Express Entry sont basées sur l’évaluation par l’agent d’immigration des qualifications scolaires du demandeur dans le contexte d’une équivalence canadienne, alors que les valeurs de Education_Qualification sont auto-déclarées par le demandeur et ne reflète pas nécessairement l’équivalence canadienne.

Education_Derived a été imputée à  ‘manquant’ pour les personnes admises en 2025 ou plus tard.

7.3.2 Imputation des variables relatives à la langue

Deux variables linguistiques ont été ajoutées à la BDIM, English_IND et French_IND, indiquant la première langue officielle connue à l’admission. Pour ceux qui ont été admis en 2018 ou avant, ils sont définis comme des résidents permanents ayant français (anglais) comme langue maternelle ou ayant une langue maternelle autre que l’anglais ou le français et déclarant le français seulement (anglais seulement) comme  la langue officielle connue à l’admission.

Pour les personnes admises en 2019 ou plus tard, elles sont définies comme des résidents permanents ayant déclaré français seulement (anglais seulement) comme langue officielle à l’admission ou ayant déclaré l’anglais et le français comme leur connaissance de la langue officielle à l’admission et déclarant le français (l’anglais) comme la langue dans laquelle ils sont le plus à l’aise.

7.4 Couverture

7.4.1 Couverture du Fichier intégré des résidents permanents et non permanents (FRPN)

Le Fichier intégré des résidents permanents et non permanents (FRPN) de 2024 contient plus de 10,2 millions d’enregistrements (tableau 5); parmi ceux-ci, plus de 8,7 millions (85,6 %) sont couplés à au moins un fichier de données fiscales. Il faut noter que les données sur l’immigration des non-déclarants et les déclarants sont incluses dans un fichier intitulé PNRF_ 1980_2024. Le tableau suivant présente la répartition des enregistrements en fonction de leur présence dans les différents fichiers d’immigration et de données fiscales. Environ 2,8 million d’enregistrements portent sur des immigrants qui étaient des résidents temporaires avant de devenir résidents permanents; plus de 2,6 million de ces enregistrements sont couplés à au moins un fichier de données fiscales. Voir l’annexe B pour des chiffres de répartition détaillés par année d’admission.

Tableau 5
Couverture des résidents permanents Sommaire du tableau
Le tableau montre les résultats de Couverture des résidents permanents Résidents permanents, Résidents permanents ayant un permis de résidence non permanente et Nombre de déclarants, calculées selon nombre, et pourcentage unités de mesure (figurant comme en-tête de colonne).
  Résidents permanents Résidents permanents ayant un permis de résidence non permanente Nombre de déclarants
nombre
Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2024.
Total des déclarants 6 041 480 2 647 430 8 688 910
Total des non déclarants 1 307 380 159 330 1 466 710
Total 7 348 860 2 806 760 10 155 620
  pourcentage
Pourcentage de déclarants 82,2 94,3 85,6

Les données relatives aux immigrants possédant des permis de résidence non permanente sont disponibles. La proportion d’immigrants ayant une expérience avant l’admission varie en fonction de l’année d’admission (graphique 6); elle va de 3,8 % en 1980 à 69,2 % en 2021. Par conséquent, la proportion d’immigrants ayant une expérience avant l’admission au début des années 1980 est sous-représentée. La proportion des immigrants déclarants possédant une expérience avant leur admission (ligne pleine) est supérieure à la proportion globale des immigrants possédant une expérience avant leur admission (ligne pointillée), car le taux de couplage de ces immigrants est supérieur à celui des immigrants sans expérience avant leur admission.

Graphique 6 Réparatition des immigrants avec permis de résidence non permanente, par année d'admission

Tableau de données du graphique 6
Tableau de données du graphique 6 Sommaire du tableau
Les données sont présentées selon Année d'admission (titres de rangée) et Tous les immigrants, Déclarants et Non-déclarants, calculées selon pourcentage unités de mesure (figurant comme en-tête de colonne).
Année d'admission Tous les immigrants Déclarants Non-déclarants
pourcentage
Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2024.
1980 3,8 4,0 2,5
1981 11,3 12,4 5,6
1982 14,2 15,5 6,7
1983 17,3 18,8 7,4
1984 19,8 21,3 8,7
1985 20,0 21,3 8,4
1986 24,7 26,4 9,3
1987 23,4 24,8 8,1
1988 11,5 12,0 5,9
1989 13,6 14,3 6,8
1990 16,5 17,6 7,8
1991 32,0 34,2 12,5
1992 34,7 36,9 14,5
1993 26,8 28,4 12,0
1994 18,1 19,4 7,4
1995 19,9 21,4 7,3
1996 19,6 21,3 6,4
1997 17,4 19,0 5,5
1998 19,3 20,7 6,8
1999 19,0 20,5 6,4
2000 18,2 19,6 6,0
2001 16,3 17,4 5,6
2002 15,1 16,3 4,7
2003 15,7 17,0 4,5
2004 19,1 20,6 5,1
2005 20,0 21,7 5,3
2006 22,7 24,5 5,4
2007 23,3 25,3 5,2
2008 23,2 25,5 4,9
2009 24,2 26,5 5,2
2010 23,0 25,7 4,3
2011 23,6 26,5 4,8
2012 25,4 28,7 4,7
2013 26,9 30,5 5,2
2014 34,1 38,8 5,9
2015 33,2 38,2 5,9
2016 30,0 35,8 5,4
2017 37,9 44,1 7,9
2018 37,3 44,0 10,1
2019 36,9 44,3 10,5
2020 47,4 54,6 18,5
2021 69,2 75,9 38,5
2022 41,5 51,0 17,6
2023 45,6 58,7 18,7

7.4.1.2 Couverture des résidents non permanents

Cette section décrit la couverture des individus qui ont seulement des permis de résidence non permanente depuis 1980, les données fiscales sont disponibles pour 35,4 % de ces personnes. Parmi les individus qui ne sont pas devenus des résidents permanents, les titulaires d'un permis de travail ont le plus haut taux de couverture, des données fiscales sont disponibles pour 44,3 % de cette population (voir le tableau 6). Il y a une grande variété de permis de résidence non permanente. Certains sont d’une durée aussi courte qu’un jour.

Tableau 6
Couverture des réseidents non permanent qui n'ont jamais obtenu la résidence permanente par type de permis Sommaire du tableau
Le tableau montre les résultats de Couverture des réseidents non permanent qui n'ont jamais obtenu la résidence permanente par type de permis avec permis de travail, avec permis d'étude, demande d'asile et Total, calculées selon nombre, et pourcentage unités de mesure (figurant comme en-tête de colonne).
  avec permis de travail avec permis d'étude demande d'asile Total
nombre
Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2024.
Total déclarants 2 404 820 1 176 830 308 380 2 767 060
Total non déclarants 3 024 280 2 103 090 451 460 5 039 830
Total 5 429 100 3 279 920 759 840 7 806 890
  pourcentage
pourcentage de déclarants 44,3 35,9 40,6 35,4

7.4.2 Taille du Fichier sur la famille T1 et couverture par année

Les fichiers de données fiscales sont disponibles à partir de 1982 pour les résidents permanents couplés. Certains résidents permanents étaient des résidents non permanents avant leur admission. Le tableau 7 fournit des détails sur la répartition des résidents permanents couplés, avec ou sans permis de résidence non permanente avant leur admission, par année d’imposition. Au moins un fichier de données fiscales est disponible pour 82,2 % de résidents permanents sans permis de résidence non permanente avant leur admission et pour 94,3 % de résidents permanents qui étaient résidents non permanents avant leur admission. Le fait que les résidents permanents possédant des permis temporaires avant leur admission présentent un taux plus élevé de déclarations de revenus que les résidents permanents sans permis avant leur admission peut s’expliquer par une exigence relative au processus de demande de résidence permanente pour les résidents non permanents.

Les résidents non permanents qui demandent la résidence permanente doivent en effet respecter l’obligation de déclaration de revenus au Canada. Le nombre de déclarants dans le fichier IMDB_T1FF augmente à mesure des années, puisque la taille de la population dans le champ d’enquête augmente.

Tableau 7
Résidents permanents et non permanents par année d’imposition Sommaire du tableau
Le tableau montre les résultats de Résidents permanents et non permanents par année d’imposition Résidents permanents admis avant 1980, Résidents permanents depuis 1980, Résidents permanents ayant un permis non-permanent , Résidents non-permanents uniquement et Nombre de déclarants, calculées selon nombre, et pourcentage unités de mesure (figurant comme en-tête de colonne).
  Résidents permanents admis avant 1980 Résidents permanents depuis 1980 Résidents permanents ayant un permis non-permanent Résidents non-permanents uniquement Nombre de déclarants
nombre
Note ...

n'ayant pas lieu de figurer

Notes : Les résidents permanents depuis 1980 excluent les cohortes d'immigrants après 2024. Les statistiques sur les résidents non permanents portent sur les personnes qui ont obtenu leur premier permis entre 1980 et 2024.
Source : Statistique Canada, Base de données longitudinales sur l'immigration 2024.
1982 1 640 170 190 520 56 290 25 550 1 912 530
1983 1 621 410 226 310 66 230 23 720 1 937 670
1984 1 616 890 265 570 80 720 24 130 1 987 300
1985 1 597 810 299 850 95 810 22 830 2 016 300
1986 1 652 690 358 040 125 890 26 880 2 163 500
1987 1 632 210 417 670 159 370 27 080 2 236 320
1988 1 651 650 510 050 201 270 36 150 2 399 120
1989 1 678 010 623 990 264 770 48 470 2 615 240
1990 1 686 250 745 400 312 270 51 840 2 795 750
1991 1 682 940 843 040 361 030 51 620 2 938 620
1992 1 688 930 949 170 404 990 51 160 3 094 240
1993 1 720 640 1 093 340 444 380 51 150 3 309 500
1994 1 705 170 1 214 690 469 850 50 290 3 440 000
1995 1 688 910 1 326 850 495 210 52 630 3 563 590
1996 1 669 930 1 434 370 516 150 54 520 3 674 970
1997 1 645 470 1 548 780 536 770 56 520 3 787 530
1998 1 621 470 1 648 640 557 000 55 450 3 882 550
1999 1 615 090 1 773 070 592 980 60 060 4 041 200
2000 1 597 430 1 916 670 633 670 67 920 4 215 700
2001 1 583 980 2 073 580 683 020 77 920 4 418 490
2002 1 554 090 2 203 520 720 910 83 550 4 562 060
2003 1 534 170 2 325 690 758 320 86 800 4 704 980
2004 1 518 200 2 456 570 800 470 89 350 4 864 600
2005 1 493 190 2 572 470 834 440 96 040 4 996 140
2006 1 475 520 2 721 580 892 030 100 510 5 189 630
2007 1 456 800 2 844 920 961 410 113 270 5 376 390
2008 1 436 650 2 969 650 1 040 590 135 820 5 582 710
2009 1 416 330 3 084 830 1 108 740 144 990 5 754 890
2010 1 391 660 3 210 440 1 167 800 152 820 5 922 720
2011 1 372 720 3 340 860 1 236 470 159 680 6 109 730
2012 1 346 180 3 458 930 1 309 920 168 790 6 283 830
2013 1 327 870 3 591 820 1 393 780 182 940 6 496 410
2014 1 306 330 3 711 190 1 487 260 190 490 6 695 270
2015 1 279 170 3 838 540 1 567 920 188 550 6 874 170
2016 1 251 110 3 960 620 1 663 680 194 220 7 069 630
2017 1 225 360 4 064 740 1 799 650 226 280 7 316 030
2018 1 202 230 4 206 730 1 972 840 279 280 7 661 080
2019 1 163 530 4 343 590 2 143 010 368 720 8 018 850
2020 1 141 140 4 413 450 2 209 760 383 520 8 147 870
2021 1 110 790 4 501 100 2 278 510 550 370 8 440 780
2022 1 081 440 4 666 900 2 349 240 984 410 9 081 990
2023 1 051 040 4 811 070 2 374 220 1 585 930 9 822 260
Total des déclarants 2 047 030 6 041 480 2 647 430 2 753 640 ... n'ayant pas lieu de figurer
Total des non‑déclarants 2 046 620 1 307 380 159 330 4 244 340 ... n'ayant pas lieu de figurer
  pourcentage
Pourcentage de déclarants 50,0 82,2 94,3 39,3 ... n'ayant pas lieu de figurer

Le graphique 7 montre que la proportion des résidents permanents qui étaient résidents non permanents avant leur admission, par année, varie de 22,6 %, le plus bas niveau pour l’année d’imposition 1983, à 33,6 %, niveau le plus élevé correspondant à l’année d’imposition de 2021.

Graphique 7 Pourcentage de résidents permanents qui étaient résidents non permanents avant leur admission, par année d'imposition

Tableau de données du graphique 7
Tableau de données du graphique 7 Sommaire du tableau
Les données sont présentées selon Année d'imposition (titres de rangée) et , calculées selon (figurant comme en-tête de colonne).
Année d'imposition Pourcentage
Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2024.
1982 22,8
1983 22,6
1984 23,3
1985 24,2
1986 26,0
1987 27,6
1988 28,3
1989 29,8
1990 29,5
1991 30,0
1992 29,9
1993 28,9
1994 27,9
1995 27,2
1996 26,5
1997 25,7
1998 25,3
1999 25,1
2000 24,8
2001 24,8
2002 24,7
2003 24,6
2004 24,6
2005 24,5
2006 24,7
2007 25,3
2008 25,9
2009 26,4
2010 26,7
2011 27,0
2012 27,5
2013 28,0
2014 28,6
2015 29,0
2016 29,6
2017 30,7
2018 31,9
2019 33,0
2020 33,4
2021 33,6
2022 33,5
2023 33,0

Un immigrant qui produit une déclaration de revenus pour une année donnée n’en produira pas nécessairement l’année suivante. Si une personne A, par exemple, a été admise en 1983, elle peut figurer dans les fichiers de données fiscales de 1984 à 1999, mais pas dans le fichier de 2000, et y figurer ensuite à nouveau de 2001 à 2013. Ainsi, des fichiers de données fiscales étaient disponibles tous les ans pour 24,8 % des déclarants de la cohorte de 1980. Une émigration externe, un décès ou un retard de déclaration peut expliquer, en outre, que des immigrants déclarants aient pu ne plus produire de déclaration de revenus ou ne pas en produire certaines années.

La plupart des immigrants déclarent leurs revenus pour la première fois l’année de leur admission ou l’année précédente ou suivante. Ainsi, sur les 251 120 immigrants admis en 2006, 100 490 (40,0 %) ont produit une déclaration de revenus pour la première fois en 2006, alors que 15 560 (6,2 %) l’ont fait en 2007 et 3 190 (1,3 %) en 2015.

7.5 Évaluation de la qualité de la données sur l’immigration

7.5.1 Évaluation de la qualité du Fichier intégré des résidents permanents et non permanents (FRPN)

Le contenu du FRPN (PNRF_1980_2024) a été évalué. Alors que la collecte des données fiscales et relatives à l’admission est obligatoire pour les personnes dans le champ d’enquête, ces dernières peuvent ne pas remplir tous les champs. Ces champs ont pu être laissés vides parce que le répondant ne connaissait pas la réponse ou pour d’autres raisons, que les utilisateurs des données ne peuvent connaître (p. ex. refus) (McLeish, 2011). L’absence de réponse à certaines questions peut présenter des problèmes lorsque la BDIM est utilisée à des fins statistiques, notamment dans les cas suivants :

  1. Si l’utilisateur de la base de données souhaite produire un échantillon fondé sur les caractéristiques pour lesquelles des enregistrements manquent, une erreur de couverture peut survenir (c.-à-d. les personnes incluses dans la base d’échantillon peuvent ne pas être représentatives de la population cible).
  2. S’il s’agit d’une absence de données informatives (p. ex. l’absence du renseignement n’est pas un cas aléatoire; l’absence de réponse indique ce que la réponse aurait été), toute analyse utilisant ces variables serait biaisée.

On a évalué la présence de variables manquantes et de valeurs non valides. Les chiffres présentés dans cette section sont arrondis. Les valeurs non valides sont soit incohérentes soit elles ne figurent pas dans les tableaux de métadonnées à la disposition des utilisateurs (voir la composante sur l’immigration du dictionnaire de données en annexe). La plupart des problèmes de qualité figurant dans le tableau 8 concernent des données recueillies dans les années 1980 et 1990. Il convient de souligner que des valeurs semblant valides peuvent également être erronées.

La variable de numéro d’identification du cas (CASE_ID) présente des taux de réponse aux éléments se situant généralement dans la frange supérieure des 90 % (généralement plus de 99 %). Cependant, pour certaines années d’admission, le taux de réponse diminue significativement (jusqu’à 80 % en 1991 et 1992). Par conséquent, toute analyse fondée sur cette variable pour toutes les années d’admission sous-représentera ces années, pour lesquelles le manque de réponse à l’élément est plus élevé (p. ex. 1986, 1987, 1991, 1992, 1993, 2020). Aucune détection des valeurs non valides n’a eu lieu pour la variable de numéro d’identification du cas (CASE_ID).

La variable d’âge à l’admission Landing_age est définie comme non valide lorsqu’elle dépasse 100, même s’il est possible dans certains cas que ces valeurs soient exactes. Il convient de souligner que, selon les valeurs de cette variable, le nombre d’immigrants admis après l’âge de 100 ans était bien plus élevé entre 1987 et 1995 que pour les autres années d’admission. Il pourrait s’agir d’un problème de saisie de données.

Dans le FRPN de la BDIM de 2024, 25 enregistrements présentaient une année de naissance antérieure à 1880 et 15 avaient une année de naissance de 1753 avec une année d’admission après 1985.

Les variables relatives au pays présentent également des problèmes de qualité. Le pays de naissance manque dans certains enregistrements pour pratiquement toutes les années d’admission. Des valeurs manquent, par exemple, pour plus de 100 enregistrements dans chacune des années de 1985 à 1993. Le pays de citoyenneté est manquant pour moins de 20 enregistrements par année d’admission pour la plupart des cohortes (à l’exception des cohortes de 2004, 2005, 2006 et 2007, où plus de 100 valeurs étaient manquantes par année d’admission). Le pays de résidence manque pour de nombreux enregistrements d’admission pour 2011 (cette valeur manque pour 1 810 enregistrements, soit 0,7 % des admissions de cette année‑là), pour 2012 (cette valeur manque pour 5 015 enregistrements, soit 1,9 % des admissions de cette année‑là) et pour 2013 (manquant pour 2 375 enregistrements, soit 0,9 % des admissions de cette année‑là).

Les variables de scolarité avant la cohorte de 2017, après imputation (voir la section 6.3) présentent plus de 150 valeurs manquantes par année d’admission de 1980 à 1984; cela équivaut à un taux de valeurs manquantes par année d’admission de moins de 0,5 %.  Une nouvelle variable a été dérivée en utilisant les données d’entrée express pour imputer le niveau de scolarité des personnes admises entre 2015 et 2020.

Le pourcentage de réponses valides pour les variables de profession est plus de 99 % pour toutes les années d’admission.

Les variables de statut dans la famille Family_Status et d'immigrants sélectionnés par le Québec CSQ_IND ont la plupart de leurs valeurs manquants pour les enregistrements des années d’admission antérieures à 1999.

La variable de langue maternelle Mother_Tongue manque pour quelques centaines d'enregistrements entre les années d'admission 1990 et 1995.

La langue officielle Official_Language a un nombre croissant de valeurs manquantes ; 2016 à 2023, entre 1 820 et 10 815 par cohorte ont une valeur manquante.

La variable de l’état matrimonial Marital_Status a eu plus de 200 valeurs manquantes par cohorte depuis 2012.

Les variables Destination_CD, Destination_CMA, Destination_CSD et Destination_Province ont moins de valeurs manquantes dans la BDIM 2023 que lors des années précédentes suite à la mise à jour avec la Classification Géographique Type (CGT) de 2016.

Les variables d’année et de mois de décès manquent ou incohérents pour certaines personnes reconnues comme décédées (Death_Indicator=1). La valeur « 9999 » a été attribuée à la variable d’année de décès Death_Year et la valeur « 99 » à celle du mois de décès Death_Month dans les cas où l’année et le mois de décès étaient inconnus ou incohérents .

Tableau 8
Évaluation de la qualité du Fichier intégré des résidents permanents et non permanents Sommaire du tableau
Les données sont présentées selon Variables du PNRF (titres de rangée) et Résponses valides , Champs vides et Résponses non valides, calculées selon nombre, pourcentage, nombre, pourcentage, nombre et pourcentage unités de mesure (figurant comme en-tête de colonne).
Variables du PNRF Résponses valides Champs vides Résponses non valides
nombre pourcentage nombre pourcentage nombre pourcentage
Notes : FRPN: Fichier intégré des résidents permanents et non permanents. RNP: Résident non permanent. Seules les variables ayant des valeurs manquantes ou invalides ont été incluses dans ce tableau. Tous les chiffres sont arrondis.
Source : Statistique Canada, Base de données longitudinales sur l’immigration 2024.
Case_ID 10 455 100 98,28 182 980 1,72 0 0,00
Landing_age 10 636 970 99,99 380 0,00 730 0,01
Birth_Year 10 637 880 100,00 180 0,00 20 0,00
Gender 10 638 080 100,00 0 0,00 0 0,00
Country_Birth 10 635 200 99,97 2 880 0,03 0 0,00
Country_Citizenship 10 636 560 99,99 1 520 0,01 0 0,00
Country_Residence 10 624 690 99,87 13 390 0,13 0 0,00
Education_Qualification 9 682 680 91,02 955 400 8,98 0 0,00
Level_of_Education 10 635 000 99,98 1 670 0,02 0 0,00
Years_of_Schooling 10 634 210 99,98 2 460 0,02 0 0,00
Education_Derived 10 127 590 95,20 510 490 4,80 0 0,00
Landing_age_6_groups 10 637 700 100,00 380 0,00 0 0,00
Landing_age_9_groups 10 637 700 100,00 380 0,00 0 0,00
Occupation_CD 10 630 530 99,93 7 550 0,07 0 0,00
NOC5-NOC2 10 582 050 99,47 56 030 0,53 0 0,00
Skill_level_CD21 10 630 520 99,93 7 560 0,07 0 0,00
Family_Status 10 635 490 99,98 2 590 0,02 0 0,00
Family_Status_rollup 10 635 490 99,98 2 590 0,02 0 0,00
Marital_status 10 631 810 99,94 6 270 0,06 0 0,00
Marital_status_rollup 10 631 810 99,94 6 270 0,06 0 0,00
Mother_Tongue 10 635 970 99,98 2 110 0,02 0 0,00
Official_Language 10 579 990 99,45 58 090 0,55 0 0,00
Special_Program 2 295 360 21,58 8 342 720 78,42 0 0,00
CSQ_ind 10 637 850 100,00 230 0,00 0 0,00
Destination_CD 10 637 710 100,00 370 0,00 0 0,00
Destination_CMA 10 637 710 100,00 370 0,00 0 0,00
Destination_CSD 10 637 710 100,00 370 0,00 0 0,00
Destination_Province 10 637 710 100,00 370 0,00 0 0,00
Permits and NPR-specific variables 3 026 840 100,00 0 0,00 0 0,00
Death_Year 10 637 420 99,99 660 0,01 0 0,00
Death_Month 10 637 370 99,99 710 0,01 0 0,00

7.5.2 Évaluation de la qualité du Fichier des résidents non permanents (FRN)

Une validation du contenu des fichiers NRF_PERMIT_1980_2024 et NRF_PERSON_1980_2024 a été effectuée. Ces fichiers contiennent des ensembles de variables différents les uns des autres. Dans le tableau 8B, les variables "Landing_Year" à « Number_All_Permits » apparaissent dans le fichier des personnes, tandis que les autres apparaissent dans le fichier des permis. Alors que la collecte des données fiscales et relatives à l’admission est obligatoire pour les personnes dans le champ d’enquête, ces dernières peuvent ne pas remplir tous les champs. Ces champs ont pu être laissés vides parce que le répondant ne connaissait pas la réponse ou pour d’autres raisons, que les utilisateurs des données ne peuvent connaître (p. ex. refus)  (McLeish 2011). L’absence de réponse à certaines questions peut présenter des problèmes lorsque la BDIM est utilisée à des fins statistiques, notamment dans les cas suivants :

  1. Si l’utilisateur de la base de données souhaite produire un échantillon fondé sur les caractéristiques pour lesquelles des enregistrements manquent, une erreur de couverture peut survenir (c.-à-d. les personnes incluses dans la base d’échantillon peuvent ne pas être représentatives de la population cible).
  2. S’il s’agit d’une absence de données informatives (p. ex. l’absence du renseignement n’est pas un cas aléatoire; l’absence de réponse indique ce que la réponse aurait été), toute analyse utilisant ces variables serait biaisée.

La présence de variables manquantes et de valeurs non valides a été évaluée. Les chiffres présentés dans cette section sont arrondis. Les valeurs non valides sont soit incohérentes, soit non répertoriées dans les tableaux de métadonnées mis à la disposition des utilisateurs (voir la composante immigration de l'annexe du dictionnaire des données). Il convient de noter que certaines valeurs apparemment valides peuvent également être erronées.

La variable Landing_year présente un pourcentage élevé de valeurs manquantes (72,1 %). Ceci est normal puisque seuls les immigrants admis ont une année d’admission et que la NRF inclut tous les résidents non permanents, qu'ils soient devenus résidents permanents ou non.

Dans le fichier NRF_PERSON de la BDIM 2023, 260 enregistrements ont une année de naissance antérieure à 1880, et 250 enregistrements ont une année de naissance antérieure à 1753.

Alors que la plupart des enregistrements ont un pays de naissance (Country_Birth), ceux dont le pays de naissance est manquant ont également une année d'admission manquante.

Les variables Effective_Date et Valid_Date n'ont pas de réponses invalides en elles-mêmes, mais lorsqu'elles sont comparées ensemble, elles peuvent produire des réponses invalides. Par exemple, la Valid_Date doit toujours arriver après la Effective_Date. Les enregistrements dont la date de validité apparaît avant la date d'entrée en vigueur peuvent être considérés comme des réponses non valides pour l'une de ces variables ou les deux. De plus, tout enregistrement dont la durée entre Effective_Date et la Valid_Date est de 5 ans ou plus peut être considéré comme suspect et comprenant probablement une valeur non valide pour une des deux variables. 0,05 % des comparaisons entre les variables Effective_Date et Valid_Date pourraient être considérées comme non valides en raison de ces deux problèmes.

Plus de 99 % des valeurs manquantes de la variable Valid_Date se produisent lorsque la variable Document_Type est 46 (demande d'asile), ce qui s'explique par le fait qu'aucune date de fin n'est attribuée aux demandes d'asile.

Les variables Destination_CD, Destination_ER, Destination_CMA, Destination_CSD et Destination_province présentent une proportion de valeurs manquantes plus faible que les autres variables, mais beaucoup plus importante que le dans le fichier PNRF. La plupart des années avant 2004 (sur la base de la variable Effective_Date) ont un taux de variables manquantes très faible, autour de 1%. Cependant, l'année 1989 a un taux de variables manquantes de près de 12 %. Après 2004, le taux manquant fluctue entre 2 % et 13 %. La BDIM 2023 utilise la Classification géographique standard (CGS) pour mettre à jour la région et le code géographiques.

Table 8B
Évaluation de la qualité des Fichiers résidents non permanents Sommaire du tableau
Les données sont présentées selon Variables du NRF (titres de rangée) et Résponses valides , Champs vides et Résponses non valides, calculées selon nombre, pourcentage, nombre, pourcentage, nombre et pourcentage unités de mesure (figurant comme en-tête de colonne).
Variables du NRF Résponses valides Champs vides Résponses non valides
nombre pourcentage nombre pourcentage nombre pourcentage
Notes : NPR : résident non permanent. Seules les variables dont les valeurs sont manquantes ou invalides ont été incluses dans le tableau. Tous les chiffres sont arrondis. Les variables Effective_Date et Valid_Date peuvent être invalides lorsqu'elles sont comparées entre elles. Voir le paragraphe de la section 7.5.2 pour plus de détails.

Source : Statistique Canada, Base de données longitudinales sur l’immigration 2024.
Landing Year 3 026 840 27,94 7 806 890 72,06 0 0,00
birth_year 10 832 160 99,99 1 320 0,01 260 0,00
birth_month 10 832 360 99,99 1 370 0,01 0 0,00
gender 10 833 730 100,00 0 0,00 0 0,00
COUNTRY_BIRTH 10 815 840 99,83 17 890 0,17 0 0,00
NUMBER_OTHER_PERMITS 10 833 730 100,00 0 0,00 0 0,00
NUMBER_REFUGEE_CLAIMS 10 833 730 100,00 0 0,00 0 0,00
NUMBER_WORK_PERMITS 10 833 730 100,00 0 0,00 0 0,00
NUMBER_STUDY_PERMITS 10 833 730 100,00 0 0,00 0 0,00
NUMBER_ALL_PERMITS 10 833 730 100,00 0 0,00 0 0,00
COUNTRY_RESIDENCE 24 579 570 95,58 1 137 450 0,04 0 0,00
COUNTRY_CITIZENSHIP 25 671 780 99,82 45 230 0,00 0 0,00
LEVEL_OF_STUDY_ROLLUP 9 116 510 35,45 16 600 500 64,55 0 0,00
LEVEL_OF_STUDY 9 116 510 35,45 16 600 500 64,55 0 0,00
SKILL_LEVEL_CD21 16 874 530 65,62 8 842 480 34,38 0 0,00
OCCUPATION_CD 16 879 190 65,63 8 837 820 34,37 0 0,00
NOC5_CD11 17 608 930 68,47 8 108 080 31,53 0 0,00
NOC4_CD11 17 608 930 68,47 8 108 080 31,53 0 0,00
NOC3_CD11 17 608 930 68,47 8 108 080 31,53 0 0,00
NOC2_CD11 17 608 930 68,47 8 108 080 31,53 0 0,00
DESTINATION_CSD 24 274 020 94,39 1 442 990 5,61 0 0,00
DESTINATION_CMA 24 274 020 94,39 1 442 990 5,61 0 0,00
DESTINATION_PROVINCE 24 274 020 94,39 1 442 990 5,61 0 0,00
DESTINATION_CD 24 274 020 94,39 1 442 990 5,61 0 0,00
DESTINATION_ER 24 274 020 94,39 1 442 990 5,61 0 0,00
effective_date 25 717 010 100,00 0 0,00 0 0,00
valid_date 24 350 730 94,69 1 366 280 5,31 0 0,00
DOCUMENT_TYPE 25 717 010 100,00 0 0,00 0 0,00
SPECIAL_PROGRAM 5 835 000 22,69 19 882 010 77,31 0 0,00
CLASSIFICATION_ID 10 365 640 41,21 14 789 780 58,79 0 0,00
LMIA_EXEMPTIONS 11 443 610 44,50 14 273 400 55,50 0 0,00

7.6 Évaluation de la qualité de la variable de la province de résidence (PRCO_)

Une validation des variables géographiques incluses dans les fichiers fiscaux de la BDIM a été effectuée. Cette section explique comment la variable Province de résidence (PRCO_) a été dérivée et sa qualité.

La province de résidence (PRCO_) est fondée sur les renseignements fournis par les déclarants, lorsque disponible. Les renseignements manquants pour la province de résidence sont remplacés par les renseignements recueillis sur le code postal de l'adresse postale de l’individu (PSCO_I), si disponible, sinon celui de la famille est utilisé (PSCO_F).

Tableau 9
Concordance entre le PRCO et le PSCO__ Sommaire du tableau
Le tableau montre les résultats de Concordance entre le PRCO et le PSCO__. Les données sont présentées selon PRCO (titres de rangée) et , calculées selon (figurant comme en-tête de colonne).
PRCO Province et Territoires Premier caractère du code postal (PSCO)
Note: Les valeurs de certain codes postales sont U ou F pour les valeurs manquantes, respectivement États‑Unis est U et, étranger est marqué par F.
0 Terre‑Neuve‑et‑Labrador A
2 Île‑du‑Prince‑Édouard B
1 Nouvelle‑Écosse C
3 Nouveau‑Brunswick E
4 Québec G, H, J
5 Ontario K, L, M, N ,P
6 Manitoba R
7 Saskatchewan S
8 Alberta T
9 Colombie‑Britannique V
10 Territoires du Nord‑Ouest X
11 Yukon Y
12 Non‑résidents manquant manquant
14 Nunavut X

Bien que la province de résidence (PRCO_) soit plus fiable que la province d’imposition (TXPCO_), certaines anomalies ont été observées principalement sur le code des non-résidents dans les déclarations des années d’imposition 1989, 1993 et 1998. Celles-ci peuvent avoir une incidence sur certaines provinces.

Pour l’année d’imposition 1993,  la IMDB_T1FF comprend des anomalies pour la province du Manitoba qui compte un nombre inhabituel de résidents (48 130 en 1993, comparativement à 33 650 l'année d'imposition précédente et à 37 365 l'année d'imposition suivante). Des changements semblables sont observés dans les Territoires du Nord-Ouest. De plus, 740 personnes sont codées comme résidant au Nunavut alors que le Nunavut a été créé en 1998. 725 personnes sont codées comme résidant dans plusieurs juridictions. Les utilisateurs peuvent utiliser l'information de la variable PSCO_F pour diminuer l'effet des anomalies sur leurs analyses qui incluent la province de résidence. Toutefois, comme nous l'avons indiqué plus haut, le moment est différent entre PSCO (basé sur le lieu de résidence lors de la transmission de la déclaration) et PRCO_ (lieu de résidence au 31 décembre).

Les enregistrements des non-résidents (PRCO_=12) semblent surestimés dans le fichier IMDB_T1FF de 1989. Il comprend 79 210 non-résidents du Canada, dont bon nombre ont un statut de résident non permanent. Les utilisateurs peuvent décider d'utiliser le code postal de l'adresse postale (PSCO_ au niveau individuel ou familial) pour calculer la valeur du PRCO_ ou retirer les non-résidents de leur analyse.

Dans le fichier FFT1 de la BDIM de 1998, IMDB_T1FF_1998, un nombre plus élevé que prévu d'enregistrements est attribué à Terre-Neuve-et-Labrador (PRCO_). Dans ces cas, le lieu de résidence de la famille au moment du dépôt de la demande est également Terre-Neuve selon la variable PSCO_F.


Date de modification :