Base de données longitudinales sur l’immigration (BDIM) Rapport technique, 2024
7 Évaluation des données et indicateurs de qualité
Passer au texte
Début du texte
7.1 Sources d’erreurs
Parce que la BDIM est produite à partir de plusieurs couplages d’enregistrements, elle comprend différentes sources d’erreurs, notamment des erreurs de couplage d’enregistrements, de mesure et de couverture. Nous expliquons, dans cette section, les sources d’erreurs et indiquerons l’importance de certaines d’entre elles.
Il convient de noter que, puisqu’il s’agit du recensement des immigrants déclarants admis depuis 1980, aucune pondération n’a été créée au sein de la BDIM. Aucune rectification n’est apportée aux années d’imposition manquantes ni aux erreurs de couplage, aucun échantillonnage n’a lieu et tous les déclarants couplés sont conservés dans l’ensemble de données final. Cependant, le couplage lui-même présente une forme d’erreur d’échantillonnage dans le cas d’échecs de couplage.
7.1.1 Erreurs de couplage d’enregistrements
Les ensembles de données produits à partir des résultats des couplages d’enregistrements peuvent comprendre des erreurs de couplage d’enregistrements. Deux types d’erreurs sont ainsi possibles : des faux positifs (fausses correspondances) et des faux négatifs (fausses non correspondances). Un couplage est un faux positif lorsque deux enregistrements ne concernant pas la même personne sont comptés comme une correspondance. Un couplage est un faux négatif lorsque deux enregistrements concernant la même personne sont comptés comme une non correspondance.
Il est possible de manquer une partie de l’historique d’un immigrant, puisque certains possèdent plusieurs numéros d’assurance sociale (NAS) au cours du temps (NAS temporaire attribué à l’admission au résident non permanent, puis NAS permanent attribué après l’admission). Ces deux NAS sont nécessaires pour constituer l’historique fiscal complet depuis l’admission de la personne au Canada. Le FCC et l’ECDS (décrit à la section 2.3) permettent de recenser ces deux NAS. Il est possible que, dans quelques cas, des liens entre les NAS échouent ou que des liens erronés soient créés.
7.1.2 Erreurs de mesure
Une erreur de mesure est la différence entre la valeur mesurée d’une variable et sa valeur réelle. On peut attribuer ce type d’erreur à plusieurs facteurs, notamment la saisie de données (p. ex. coquilles) et les erreurs des répondants (p. ex. mauvaise interprétation de la question posée). On a tenu compte de ce type d’erreur lors de la création du Fichier intégré des résidents permanents et non permanents (FRPN) pour éviter les renseignements contradictoires pour toute personne. Lorsqu’un enregistrement existe pour une personne dans le FIR et dans le FRN, par exemple, et que les variables sociodémographiques présentent des valeurs incohérentes, les valeurs à l’admission (celles du FIR) sont conservées. Voir les sections 7.2 et 7.5 qui fournissent certains chiffres.
7.1.3 Erreurs de couverture
Les erreurs de couverture proviennent d’omissions, de l’inclusion d’unités erronées, d’enregistrements en double et d’erreurs de classification d’enregistrements dans la base de données. Ces erreurs de couverture peuvent provenir d’une couverture inadéquate de la population. Elles peuvent se traduire par des estimations biaisées et les répercussions peuvent varier pour différents sous-groupes de la population. Ces erreurs entraînent souvent un sous-dénombrement. Le sous-dénombrement dans le cadre de la BDIM provient en partie de l’exclusion de la base de données des fichiers de données fiscales d’immigrants déclarants. Aucun enregistrement ne figure dans le fichier IMDB_T1FF pour les immigrants qui ne produisent pas de déclaration de revenus pour une année donnée ou qui le font en retard, même s’ils sont couplés aux données fiscales et font partie de la population d’intérêt. Si, pour une raison quelconque, l’enregistrement d’un immigrant n’est pas inclus dans le Fichier des immigrants reçus (FIR), il ne fera pas partie de la BDIM. Un surdénombrement survient lors de l’ajout à la base de données d’enregistrements exclus de la population cible. Un immigrant peut faire l’objet de plusieurs enregistrements dans le FIR du fait de plusieurs admissions non reconnues comme telles, par exemple. Veuillez-vous reporter à la section 7.4 et à l’annexe B pour de plus amples détails relatifs à la couverture de la BDIM.
7.2 Exactitude des données
Cette section porte sur l’exactitude des données relatives à l’immigration. Pour de plus amples détails sur l’exactitude du FFT1, veuillez-vous reporter au document sur le FFT1 (numéro d’enregistrement 4105).
L’exactitude de la BDIM dépend de la représentativité de la population qui y est incluse. Une étude menée au cours des premières années de la BDIM a conclu que cette dernière « semble être représentative de la population la plus susceptible de produire des déclarations de revenus. Par conséquent, les résultats obtenus à partir de la BDIM ne devraient pas être appliqués à la population immigrante dans son ensemble, mais plutôt à l’univers des immigrants qui produisent des déclarations de revenus » (Carpentier et Pinsonneault, 1994).
Les raisons expliquant les différences entre les déclarants et la population totale des personnes nées à l’étranger sont expliquées dans un article de Badets et Langlois (2000) décrivant les défis d’utilisation de la BDIM :
Les caractéristiques de la population immigrante qui produit des déclarations de revenus diffèrent de celles de l’ensemble de la population née à l’étranger, étant donné que la probabilité ou la nécessité de produire une déclaration de revenus varie selon l’âge, la situation familiale de la personne et d’autres facteurs. On pourrait s’attendre à ce qu’un pourcentage plus élevé d’immigrants de sexe masculin produisent une déclaration de revenus, notamment parce qu’ils ont des taux de participation au marché du travail plus élevés que les femmes. Le niveau de « saisie » des immigrants dans la BDIM est aussi influencé par les changements touchant l’impôt sur le revenu. Par exemple, la mise en place de programmes de crédits d’impôt non remboursables à l’échelle fédérale et provinciale incite les personnes qui n’ont pas de revenus imposables à produire une déclaration de revenus pour être admissibles à certains crédits d’impôt.
Ces commentaires sur la représentativité de la BDIM s’appliquent toujours.
7.2.1 BDIM de 2023: Taux de couplage
Cette section porte sur la BDIM de 2024. Le taux global de couplage entre les données d'immigration d'IRCC et le Dépôt d’enregistrements dérivés de l’ECDS était de 97,1 % (voir section 4). Un lien ne signifie pas nécessairement qu'une déclaration fiscale est disponible puisqu'il est possible de coupler les personnes à charge des déclarants ou des immigrants qui n'ont pas encore produit leur déclaration de revenus. Ce taux de couplage théorique informe principalement sur la façon dont les fichiers d’IRCC pourraient être associés dans un environnement référentiel plus large.
Parmi les immigrants admis entre 1980 et 2024, 85,6 % étaient liés à au moins un FFT1. Ce taux représente la couverture effective du couplage entre les déclarations fiscales et les fichiers d'immigration. Tel que présenté dans les statistiques suivantes, ce taux de couverture peut varier selon le sexe et l'âge.
La proportion de déclarants couplés selon le groupe d'âge au moment de l'admission et le sexe est indiquée au tableau 4. On s'attend à ce que les taux plus faibles pour le groupe d'âge de 0 à 14 ans soient observés puisque les personnes de ce groupe d'âge ne sont pas en âge de travailler. Voir l'annexe B pour les taux selon le sexe, le groupe d'âge et la cohorte d'admission.
| Âge à l’admission | |||||||
|---|---|---|---|---|---|---|---|
| 0 à 14 ans | 15 à 24 ans | 25 à 34 ans | 35 à 49 ans | 50 à 64 ans | 65 ans et plus | Total | |
| pourcentage | |||||||
| Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2024. | |||||||
| Hommes | 57,4 | 89,9 | 91,9 | 91,6 | 87,7 | 74,7 | 83,4 |
| Femmes | 56,6 | 89,2 | 91,2 | 92,1 | 85,7 | 73,6 | 83,3 |
| Total | 57,0 | 89,5 | 91,5 | 91,8 | 86,6 | 74,1 | 83,4 |
À mesure que les immigrants vieillissent, ils commencent à produire des déclarations de revenus et sont inclus dans la BDIM. Le graphique 1 montre que, parmi les immigrants admis à tout âge de 0 à 14 ans, la proportion de déclarants couplés est supérieure pour les immigrants admis avant 2000 que pour ceux admis depuis 2000. Les immigrants récents ont des taux de couplage inférieurs. Voir l’annexe B pour un tableau présentant la proportion de déclarants couplés par groupe d’âge à l’admission, sexe et décennie d’admission.

Tableau de données du graphique 1
| Cohortes | Tranche d'âge | |||||
|---|---|---|---|---|---|---|
| 0 à 14 ans | 15 à 24 ans | 25 à 34 ans | 35 à 49 ans | 50 à 64 ans | 65 ans et plus | |
| proportion | ||||||
| Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2024. | ||||||
| Cohortes de 1980 à 1989 | 0,82 | 0,93 | 0,94 | 0,93 | 0,83 | 0,61 |
| Cohortes de 1990 à 1999 | 0,81 | 0,92 | 0,93 | 0,93 | 0,89 | 0,76 |
| Cohortes de 2000 à 2009 | 0,80 | 0,93 | 0,92 | 0,93 | 0,93 | 0,88 |
| Cohortes de 2010 à 2019 | 0,37 | 0,96 | 0,96 | 0,95 | 0,93 | 0,86 |
| Cohortes de 2020 à 2023 | 0,02 | 0,82 | 0,92 | 0,93 | 0,81 | 0,70 |
Le graphique 2 illustre la proportion de déclarants ainsi que le nombre de déclarants et de non-déclarants par année d’admission; la mention « non déclarant » indique qu’aucun enregistrement dans le FFT1 n’est disponible. Dans la BDIM de 2024, le taux de déclaration varie en fonction de l’année d’admission, de 67,3 % pour les personnes admises en 2023 à 91,3 % pour celles admises en 1989. Le taux de déclaration augmente à mesure du nombre d’années de présence des immigrants au Canada; cela peut expliquer pourquoi les taux de couplage sont supérieurs pour les immigrants admis dans les années 1990 et le début des années 2000. Voir l’annexe B, tableaux 14 et 15, pour connaître des chiffres de répartition détaillés par année d’admission.

Tableau de données du graphique 2
| Année d'admission | Déclarants | Non-déclarants | Taux |
|---|---|---|---|
| nombre d'immigrants | pourcentage | ||
| Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2024. | |||
| 1980 | 120 470 | 22 530 | 84,2 |
| 1981 | 107 740 | 20 730 | 83,9 |
| 1982 | 103 440 | 17 520 | 85,5 |
| 1983 | 77 140 | 11 820 | 86,7 |
| 1984 | 77 520 | 10 430 | 88,1 |
| 1985 | 75 110 | 8 780 | 89,5 |
| 1986 | 89 140 | 9 540 | 90,3 |
| 1987 | 137 660 | 13 340 | 91,2 |
| 1988 | 146 260 | 14 240 | 91,1 |
| 1989 | 173 890 | 16 490 | 91,3 |
| 1990 | 192 200 | 22 850 | 89,4 |
| 1991 | 208 620 | 22 800 | 90,1 |
| 1992 | 228 730 | 24 780 | 90,2 |
| 1993 | 230 760 | 24 360 | 90,5 |
| 1994 | 198 580 | 24 360 | 89,1 |
| 1995 | 188 620 | 22 920 | 89,2 |
| 1996 | 198 370 | 26 170 | 88,3 |
| 1997 | 189 190 | 25 440 | 88,1 |
| 1998 | 155 380 | 17 770 | 89,7 |
| 1999 | 168 910 | 19 910 | 89,5 |
| 2000 | 203 760 | 22 300 | 90,1 |
| 2001 | 225 000 | 23 870 | 90,4 |
| 2002 | 204 920 | 22 380 | 90,2 |
| 2003 | 198 130 | 21 450 | 90,2 |
| 2004 | 212 770 | 22 580 | 90,4 |
| 2005 | 235 630 | 26 060 | 90,0 |
| 2006 | 226 760 | 24 350 | 90,3 |
| 2007 | 212 760 | 23 560 | 90,0 |
| 2008 | 219 500 | 27 190 | 89,0 |
| 2009 | 224 010 | 27 730 | 89,0 |
| 2010 | 244 740 | 35 350 | 87,4 |
| 2011 | 214 090 | 33 920 | 86,3 |
| 2012 | 221 470 | 35 430 | 86,2 |
| 2013 | 220 850 | 37 350 | 85,5 |
| 2014 | 223 030 | 36 750 | 85,9 |
| 2015 | 229 130 | 42 100 | 84,5 |
| 2016 | 239 450 | 56 090 | 81,0 |
| 2017 | 236 450 | 48 720 | 82,9 |
| 2018 | 255 880 | 63 550 | 80,1 |
| 2019 | 265 810 | 73 740 | 78,3 |
| 2020 | 146 940 | 36 690 | 80,0 |
| 2021 | 332 060 | 71 930 | 82,2 |
| 2022 | 312 040 | 123 410 | 71,7 |
| 2023 | 316 020 | 153 480 | 67,3 |
7.2.2 Disponibilité de la date de décès
L’année et le mois d’un décès, ainsi que l’indicateur de décès, sont inclus dans le FRPN. Dans la BDIM de 2021, ces variables ont été couplées à l'aide de la Base canadienne de données sur la mortalité (BCDM). Dans le passé, ces variables étaient fondées sur la Base de mortalité amalgamée (BMA) de Statistique Canada, qui est un ensemble de données archivé qui combine des enregistrements entre la BCDM, les statistiques de l'état civil, et des fichiers fiscaux. La BCDM est une base de données administratives qui recueille des renseignements sur les dates et les causes de décès dans tous les registres provinciaux et territoriaux de l'état civil au Canada. Un certain sous-dénombrement, bien que minime, existe dans la base de données, car il ne comprend pas les décès de Canadiens (1) qui sont morts à l'extérieur du Canada, à l'exception des États-Unis ; (2) qui ont servi comme membres des Forces canadiennes, ou (3) dont les corps n'ont pas été identifiés. Il est à noter que la BCDM ne comprend pas les décès qui ont été déclarés dans les dossiers fiscaux.
Le graphique 3 décrit la tendance générale du nombre de décès par an depuis 1974 pour les immigrants arrivés depuis 1952. Les données antérieures à 1980 ont été ajoutées récemment à la BDIM. La valeur « 9999 » représente les enregistrements d’immigrants décédés pour lesquels l’année de décès n’est pas disponible.

Tableau de données du graphique 3
| Année de décès | Résidents permanents entre 1952 et 1979 | Résidents permanents depuis 1980 |
|---|---|---|
| nombre de décès | ||
Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2024. |
||
| 1974 | 4 840 | . indisponible pour toute période de référence |
| 1975 | 5 270 | . indisponible pour toute période de référence |
| 1976 | 5 580 | . indisponible pour toute période de référence |
| 1977 | 6 220 | . indisponible pour toute période de référence |
| 1978 | 6 530 | . indisponible pour toute période de référence |
| 1979 | 7 090 | . indisponible pour toute période de référence |
| 1980 | 7 700 | 90 |
| 1981 | 7 620 | 300 |
| 1982 | 7 940 | 510 |
| 1983 | 8 510 | 740 |
| 1984 | 8 920 | 950 |
| 1985 | 9 350 | 1 110 |
| 1986 | 10 060 | 1 340 |
| 1987 | 10 420 | 1 630 |
| 1988 | 11 040 | 1 900 |
| 1989 | 11 490 | 2 210 |
| 1990 | 11 790 | 2 450 |
| 1991 | 12 570 | 2 910 |
| 1992 | 13 130 | 3 210 |
| 1993 | 13 900 | 3 740 |
| 1994 | 14 390 | 4 280 |
| 1995 | 15 170 | 4 730 |
| 1996 | 15 610 | 5 120 |
| 1997 | 16 040 | 5 440 |
| 1998 | 16 610 | 5 760 |
| 1999 | 17 370 | 6 180 |
| 2000 | 17 390 | 6 400 |
| 2001 | 17 840 | 6 930 |
| 2002 | 18 560 | 7 320 |
| 2003 | 19 030 | 8 100 |
| 2004 | 19 250 | 8 280 |
| 2005 | 19 990 | 8 650 |
| 2006 | 20 230 | 9 140 |
| 2007 | 21 160 | 9 850 |
| 2008 | 21 690 | 10 280 |
| 2009 | 22 210 | 10 760 |
| 2010 | 22 560 | 11 120 |
| 2011 | 22 820 | 11 920 |
| 2012 | 23 390 | 12 180 |
| 2013 | 24 680 | 13 190 |
| 2014 | 25 220 | 14 100 |
| 2015 | 26 110 | 15 010 |
| 2016 | 26 730 | 15 850 |
| 2017 | 27 550 | 17 200 |
| 2018 | 27 860 | 18 130 |
| 2019 | 28 000 | 19 040 |
| 2020 | 31 180 | 23 350 |
| 2021 | 30 590 | 24 660 |
| 2022 | 32 250 | 25 690 |
| 2023 | 31 370 | 24 700 |
7.2.3 Déclarants avant l’admission par rapport aux enregistrements du Fichier des résidents non permanents (FRN)
Les résultats inclus dans cette section sont tirés d’une étude fondée sur la BDIM de 2014. Les déclarants avant l’admission sont des immigrants qui ont produit une déclaration de revenus avant leur année d’admission. Il est parfois déduit que tous les déclarants avant l’admission sont des immigrants qui étaient des résidents non permanents avant leur admission. Cette section explique pourquoi ce n’est pas le cas. Au total, 1,26 million de personnes ont produit une déclaration de revenus avant leur admission officielle depuis 1980; sur ce total, 212 500 ne sont pas couplées à un enregistrement de résident non permanent, contrairement à ce à quoi l’on pourrait s’attendre. Après une enquête approfondie, on a découvert que la plupart des déclarants avant l’admission qui étaient des résidents permanents non couplés à un enregistrement de résident non permanent étaient probablement des immigrants ayant produit une déclaration de revenus lorsque cela n’était pas requis : 96 % de ces déclarants avant l’admission ont uniquement produit une déclaration de revenus pour l’année précédant leur année d’admission et 75 % n’ont déclaré aucun revenu (96 % n’avaient aucun salaire). Comme le montre le graphique 4, la plupart de ces déclarants avant l’admission ont été admis au cours des premiers mois de l’année, avant la date d’échéance de la production d’une déclaration de revenus pour l’année précédente. Il semble que certains immigrants admis avant le mois de mai ont produit une déclaration de revenus pour l’année précédant leur année d’admission; ce qu’ils n’étaient pas tenus de faire.
Selon ces résultats, il est justifié de supprimer les enregistrements présentant les variables de déclarant avant l’admission Prefiler_ind=1 et FIRST_EFFECTIVE_YEAR=. des études sur les immigrants ayant une expérience avant leur admission dépend de l’analyse, puisque FIRST_EFFECTIVE_YEAR=. signifie qu’aucun enregistrement ne figure dans le fichier de permis de résidents non permanents.

Tableau de données du graphique 4
| Mois d'admission | Nombre d'immigrants |
|---|---|
| Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2014. | |
| janvier | 32 300 |
| février | 36 100 |
| mars | 35 500 |
| avril | 24 100 |
| mai | 20 500 |
| juin | 18 200 |
| juillet | 16 100 |
| août | 11 200 |
| septembre | 9 800 |
| octobre | 5 500 |
| novembre | 2 000 |
| décembre | 1 200 |
Tous les immigrants ayant une expérience avant leur admission ne sont pas considérés comme étant des déclarants avant l’admission : 478 100 immigrants disposent d’enregistrements de résidents non permanents avec la variable Prefiler_ind=0. En fonction du sujet étudié, utiliser la variable FIRST_EFFECTIVE_YEAR<>. ou le nombre de permis de résidence temporaire (variable NUMBER_ALL_PERMITS) est plus approprié pour étudier les immigrants ayant une expérience avant leur admission. La variable Prefiler_ind=0 indique qu’aucune déclaration de revenus n’a été produite avant l’admission, mais elle ne signifie pas que la personne n’a pas d’expérience au Canada avant son admission.
7.2.4 Indicateur de conjoint
La BDIM contient des variables permettant aux utilisateurs de données d’obtenir des renseignements sur l’état matrimonial et les conjoints. La section suivante présente les résultats d’une étude menée sur la BDIM de 2012. Aucune modification majeure n’a été apportée depuis aux codes d’état matrimonial ni à l’indicateur relatif à la famille.
L’identificateur de conjoint (SP__IDI) est dérivé des fichiers de données fiscales. Ce renseignement peut uniquement être dérivé lorsque le répondant déclare son conjoint ou sa conjointe lors de sa déclaration de revenus; cela entraîne une sous-estimation des couples par rapport à l’état matrimonial déclaré dans les fichiers de données fiscales. Il est également possible à partir du FFT1 d’obtenir l’état matrimonial au moment de la déclaration.
Avant 1991, la catégorie « célibataire » n’était pas proposée comme état matrimonial (MSTCO). La catégorie « conjoint de fait » est disponible depuis 1992 pour tous les ensembles de données (1982 à 2012). Depuis 1992, la proportion des enregistrements de la BDIM indiquant un état matrimonial « célibataire » varie entre 20 % et 30 %. La proportion de personnes « séparées » a diminué, passant de 30 % avant 1992 à 4 % par la suite. Des modifications de tendance n’ont pas influé sur les autres catégories d’état matrimonial.
Une analyse portant sur la répartition de l’état matrimonial (MSTCO des fichiers de données fiscales) et l’identificateur de conjoint (SP__IDI) a révélé des différences entre ces deux variables. Ces différences sont dues à l’absence de valeurs d’état matrimonial dans certains enregistrements. Dans une situation parfaite, les enregistrements de toutes les personnes mariées présenteraient des renseignements sur le conjoint et ceux de toutes les personnes célibataires n’en indiqueraient pas. L’analyse effectuée a indiqué que la qualité des données s’était améliorée après 1992, lorsque les états matrimoniaux distincts « conjoint de fait » et « célibataire » ont été introduits.
Lacunes d’indication de conjoint
À la suite d’un examen de l’historique longitudinal des immigrants sur la BDIM de 2012, on a relevé des cas où le conjoint ou conjoint de fait manquait (ou différait) pour une année donnée et où le même conjoint était déclaré deux ou trois ans plus tard. Le graphique 5 fournit un résumé de ces lacunes.

Tableau de données du graphique 5
| Année d'admission | Pourcentage |
|---|---|
| Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2012. | |
| 1980 | 16,8 |
| 1981 | 16,6 |
| 1982 | 17,1 |
| 1983 | 17,7 |
| 1984 | 17,4 |
| 1985 | 17,7 |
| 1986 | 17,7 |
| 1987 | 16,9 |
| 1988 | 14,4 |
| 1989 | 13,9 |
| 1990 | 13,4 |
| 1991 | 14,4 |
| 1992 | 13,5 |
| 1993 | 12,7 |
| 1994 | 9,8 |
| 1995 | 9,4 |
| 1996 | 8,7 |
| 1997 | 8,1 |
| 1998 | 7,8 |
| 1999 | 7,1 |
| 2000 | 6,3 |
| 2001 | 5,6 |
| 2002 | 5,0 |
| 2003 | 4,6 |
| 2004 | 4,0 |
| 2005 | 3,1 |
| 2006 | 2,9 |
| 2007 | 2,4 |
| 2008 | 1,8 |
| 2009 | 1,1 |
| 2010 | 0,7 |
| 2011 | 0,5 |
La plupart des immigrants du fichier ont un conjoint ou non entre 1980 et 2012 selon les fichiers IMDB_T1FF. Il faut souligner qu’aucun état matrimonial (et aucun renseignement sur le conjoint) n’est disponible pour 1,2 million d’immigrants sur environ 6 millions d’immigrants.
7.3 Variables imputées
7.3.1 Imputation des variables relatives à la scolarité
Un problème de qualité des données a en outre été relevé quant aux variables relatives au niveau de scolarité et aux années d’études. Une proportion non négligeable de personnes n’ayant pas déclaré leur niveau de scolarité ou d’années d’études ont reçu le code « 0 » soit « aucun » plutôt que « manquant » pour les variables EDUCATION_QUALIFICATIONS et YEARS_OF_SCHOOLING. Ce problème est devenu courant de 2011 à 2014. En 2011, 35 % des immigrants ont indiqué ne pas avoir suivi d’études, par rapport à environ 10 % dans les années 1990.
Ce problème a été résolu en imputant des variables de scolarité à partir des moyennes des valeurs des variables de scolarité de 2008 à 2010, pour refléter les variables de scolarité de l’année la plus récente. Pour cette imputation, on a utilisé des variables telles que l’âge à l’admission, le groupement de catégories d’immigration 2, la profession envisagée, le sexe et le pays de dernière résidence. La méthodologie d’imputation du plus proche voisin a été employée. La variable d’imputation de la scolarité Education_imputation_ind (0: non; 1: oui), disponible dans le FRPN, a été créée pour déterminer les enregistrements au sein desquels les variables de scolarité ont été imputées.
Pour les immigrants admis en 2016, le nombre de cas où une scolarité non-déclarée a reçu le code « 0 » ou « aucun » plutôt que « manquant » a été réduit. Cependant, un nombre non négligeable d’enregistrements avait un niveau de scolarité manquant avec des années d’études valides. Pour ces enregistrements, les années d’études ont été utilisées pour imputer une valeur pour le niveau de scolarité.
Pour les demandeurs principaux admis depuis 2015, sous le processus d’entrée express, les années de scolarisation sont sous-estimées.
Pour la BDIM 2024, les personnes admises entre 2015 et 2024 qui ont été connectées au dossier Express Entry ont vu leur éducation imputée en utilisant les valeurs trouvées dans le fichier Express Entry. Une variable d’éducation plus complète, Education_Derived, a été créée, combinant les données de Educatoin_Qualification pour ceux qui n’ont pas été trouvés dans le fichier Express Entry, et les nouvelle valeurs provenant de Express Entry.
Les utilisateurs devraient noter que les valeurs du fichier d’Express Entry sont basées sur l’évaluation par l’agent d’immigration des qualifications scolaires du demandeur dans le contexte d’une équivalence canadienne, alors que les valeurs de Education_Qualification sont auto-déclarées par le demandeur et ne reflète pas nécessairement l’équivalence canadienne.
Education_Derived a été imputée à ‘manquant’ pour les personnes admises en 2025 ou plus tard.
7.3.2 Imputation des variables relatives à la langue
Deux variables linguistiques ont été ajoutées à la BDIM, English_IND et French_IND, indiquant la première langue officielle connue à l’admission. Pour ceux qui ont été admis en 2018 ou avant, ils sont définis comme des résidents permanents ayant français (anglais) comme langue maternelle ou ayant une langue maternelle autre que l’anglais ou le français et déclarant le français seulement (anglais seulement) comme la langue officielle connue à l’admission.
Pour les personnes admises en 2019 ou plus tard, elles sont définies comme des résidents permanents ayant déclaré français seulement (anglais seulement) comme langue officielle à l’admission ou ayant déclaré l’anglais et le français comme leur connaissance de la langue officielle à l’admission et déclarant le français (l’anglais) comme la langue dans laquelle ils sont le plus à l’aise.
7.4 Couverture
7.4.1 Couverture du Fichier intégré des résidents permanents et non permanents (FRPN)
Le Fichier intégré des résidents permanents et non permanents (FRPN) de 2024 contient plus de 10,2 millions d’enregistrements (tableau 5); parmi ceux-ci, plus de 8,7 millions (85,6 %) sont couplés à au moins un fichier de données fiscales. Il faut noter que les données sur l’immigration des non-déclarants et les déclarants sont incluses dans un fichier intitulé PNRF_ 1980_2024. Le tableau suivant présente la répartition des enregistrements en fonction de leur présence dans les différents fichiers d’immigration et de données fiscales. Environ 2,8 million d’enregistrements portent sur des immigrants qui étaient des résidents temporaires avant de devenir résidents permanents; plus de 2,6 million de ces enregistrements sont couplés à au moins un fichier de données fiscales. Voir l’annexe B pour des chiffres de répartition détaillés par année d’admission.
| Résidents permanents | Résidents permanents ayant un permis de résidence non permanente | Nombre de déclarants | |
|---|---|---|---|
| nombre | |||
| Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2024. | |||
| Total des déclarants | 6 041 480 | 2 647 430 | 8 688 910 |
| Total des non déclarants | 1 307 380 | 159 330 | 1 466 710 |
| Total | 7 348 860 | 2 806 760 | 10 155 620 |
| pourcentage | |||
| Pourcentage de déclarants | 82,2 | 94,3 | 85,6 |
Les données relatives aux immigrants possédant des permis de résidence non permanente sont disponibles. La proportion d’immigrants ayant une expérience avant l’admission varie en fonction de l’année d’admission (graphique 6); elle va de 3,8 % en 1980 à 69,2 % en 2021. Par conséquent, la proportion d’immigrants ayant une expérience avant l’admission au début des années 1980 est sous-représentée. La proportion des immigrants déclarants possédant une expérience avant leur admission (ligne pleine) est supérieure à la proportion globale des immigrants possédant une expérience avant leur admission (ligne pointillée), car le taux de couplage de ces immigrants est supérieur à celui des immigrants sans expérience avant leur admission.

Tableau de données du graphique 6
| Année d'admission | Tous les immigrants | Déclarants | Non-déclarants |
|---|---|---|---|
| pourcentage | |||
| Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2024. | |||
| 1980 | 3,8 | 4,0 | 2,5 |
| 1981 | 11,3 | 12,4 | 5,6 |
| 1982 | 14,2 | 15,5 | 6,7 |
| 1983 | 17,3 | 18,8 | 7,4 |
| 1984 | 19,8 | 21,3 | 8,7 |
| 1985 | 20,0 | 21,3 | 8,4 |
| 1986 | 24,7 | 26,4 | 9,3 |
| 1987 | 23,4 | 24,8 | 8,1 |
| 1988 | 11,5 | 12,0 | 5,9 |
| 1989 | 13,6 | 14,3 | 6,8 |
| 1990 | 16,5 | 17,6 | 7,8 |
| 1991 | 32,0 | 34,2 | 12,5 |
| 1992 | 34,7 | 36,9 | 14,5 |
| 1993 | 26,8 | 28,4 | 12,0 |
| 1994 | 18,1 | 19,4 | 7,4 |
| 1995 | 19,9 | 21,4 | 7,3 |
| 1996 | 19,6 | 21,3 | 6,4 |
| 1997 | 17,4 | 19,0 | 5,5 |
| 1998 | 19,3 | 20,7 | 6,8 |
| 1999 | 19,0 | 20,5 | 6,4 |
| 2000 | 18,2 | 19,6 | 6,0 |
| 2001 | 16,3 | 17,4 | 5,6 |
| 2002 | 15,1 | 16,3 | 4,7 |
| 2003 | 15,7 | 17,0 | 4,5 |
| 2004 | 19,1 | 20,6 | 5,1 |
| 2005 | 20,0 | 21,7 | 5,3 |
| 2006 | 22,7 | 24,5 | 5,4 |
| 2007 | 23,3 | 25,3 | 5,2 |
| 2008 | 23,2 | 25,5 | 4,9 |
| 2009 | 24,2 | 26,5 | 5,2 |
| 2010 | 23,0 | 25,7 | 4,3 |
| 2011 | 23,6 | 26,5 | 4,8 |
| 2012 | 25,4 | 28,7 | 4,7 |
| 2013 | 26,9 | 30,5 | 5,2 |
| 2014 | 34,1 | 38,8 | 5,9 |
| 2015 | 33,2 | 38,2 | 5,9 |
| 2016 | 30,0 | 35,8 | 5,4 |
| 2017 | 37,9 | 44,1 | 7,9 |
| 2018 | 37,3 | 44,0 | 10,1 |
| 2019 | 36,9 | 44,3 | 10,5 |
| 2020 | 47,4 | 54,6 | 18,5 |
| 2021 | 69,2 | 75,9 | 38,5 |
| 2022 | 41,5 | 51,0 | 17,6 |
| 2023 | 45,6 | 58,7 | 18,7 |
7.4.1.2 Couverture des résidents non permanents
Cette section décrit la couverture des individus qui ont seulement des permis de résidence non permanente depuis 1980, les données fiscales sont disponibles pour 35,4 % de ces personnes. Parmi les individus qui ne sont pas devenus des résidents permanents, les titulaires d'un permis de travail ont le plus haut taux de couverture, des données fiscales sont disponibles pour 44,3 % de cette population (voir le tableau 6). Il y a une grande variété de permis de résidence non permanente. Certains sont d’une durée aussi courte qu’un jour.
| avec permis de travail | avec permis d'étude | demande d'asile | Total | |
|---|---|---|---|---|
| nombre | ||||
| Source : Statistique Canada, Base de données longitudinales sur l'immigration de 2024. | ||||
| Total déclarants | 2 404 820 | 1 176 830 | 308 380 | 2 767 060 |
| Total non déclarants | 3 024 280 | 2 103 090 | 451 460 | 5 039 830 |
| Total | 5 429 100 | 3 279 920 | 759 840 | 7 806 890 |
| pourcentage | ||||
| pourcentage de déclarants | 44,3 | 35,9 | 40,6 | 35,4 |
7.4.2 Taille du Fichier sur la famille T1 et couverture par année
Les fichiers de données fiscales sont disponibles à partir de 1982 pour les résidents permanents couplés. Certains résidents permanents étaient des résidents non permanents avant leur admission. Le tableau 7 fournit des détails sur la répartition des résidents permanents couplés, avec ou sans permis de résidence non permanente avant leur admission, par année d’imposition. Au moins un fichier de données fiscales est disponible pour 82,2 % de résidents permanents sans permis de résidence non permanente avant leur admission et pour 94,3 % de résidents permanents qui étaient résidents non permanents avant leur admission. Le fait que les résidents permanents possédant des permis temporaires avant leur admission présentent un taux plus élevé de déclarations de revenus que les résidents permanents sans permis avant leur admission peut s’expliquer par une exigence relative au processus de demande de résidence permanente pour les résidents non permanents.
Les résidents non permanents qui demandent la résidence permanente doivent en effet respecter l’obligation de déclaration de revenus au Canada. Le nombre de déclarants dans le fichier IMDB_T1FF augmente à mesure des années, puisque la taille de la population dans le champ d’enquête augmente.
| Résidents permanents admis avant 1980 | Résidents permanents depuis 1980 | Résidents permanents ayant un permis non-permanent | Résidents non-permanents uniquement | Nombre de déclarants | |
|---|---|---|---|---|---|
| nombre | |||||
Source : Statistique Canada, Base de données longitudinales sur l'immigration 2024. |
|||||
| 1982 | 1 640 170 | 190 520 | 56 290 | 25 550 | 1 912 530 |
| 1983 | 1 621 410 | 226 310 | 66 230 | 23 720 | 1 937 670 |
| 1984 | 1 616 890 | 265 570 | 80 720 | 24 130 | 1 987 300 |
| 1985 | 1 597 810 | 299 850 | 95 810 | 22 830 | 2 016 300 |
| 1986 | 1 652 690 | 358 040 | 125 890 | 26 880 | 2 163 500 |
| 1987 | 1 632 210 | 417 670 | 159 370 | 27 080 | 2 236 320 |
| 1988 | 1 651 650 | 510 050 | 201 270 | 36 150 | 2 399 120 |
| 1989 | 1 678 010 | 623 990 | 264 770 | 48 470 | 2 615 240 |
| 1990 | 1 686 250 | 745 400 | 312 270 | 51 840 | 2 795 750 |
| 1991 | 1 682 940 | 843 040 | 361 030 | 51 620 | 2 938 620 |
| 1992 | 1 688 930 | 949 170 | 404 990 | 51 160 | 3 094 240 |
| 1993 | 1 720 640 | 1 093 340 | 444 380 | 51 150 | 3 309 500 |
| 1994 | 1 705 170 | 1 214 690 | 469 850 | 50 290 | 3 440 000 |
| 1995 | 1 688 910 | 1 326 850 | 495 210 | 52 630 | 3 563 590 |
| 1996 | 1 669 930 | 1 434 370 | 516 150 | 54 520 | 3 674 970 |
| 1997 | 1 645 470 | 1 548 780 | 536 770 | 56 520 | 3 787 530 |
| 1998 | 1 621 470 | 1 648 640 | 557 000 | 55 450 | 3 882 550 |
| 1999 | 1 615 090 | 1 773 070 | 592 980 | 60 060 | 4 041 200 |
| 2000 | 1 597 430 | 1 916 670 | 633 670 | 67 920 | 4 215 700 |
| 2001 | 1 583 980 | 2 073 580 | 683 020 | 77 920 | 4 418 490 |
| 2002 | 1 554 090 | 2 203 520 | 720 910 | 83 550 | 4 562 060 |
| 2003 | 1 534 170 | 2 325 690 | 758 320 | 86 800 | 4 704 980 |
| 2004 | 1 518 200 | 2 456 570 | 800 470 | 89 350 | 4 864 600 |
| 2005 | 1 493 190 | 2 572 470 | 834 440 | 96 040 | 4 996 140 |
| 2006 | 1 475 520 | 2 721 580 | 892 030 | 100 510 | 5 189 630 |
| 2007 | 1 456 800 | 2 844 920 | 961 410 | 113 270 | 5 376 390 |
| 2008 | 1 436 650 | 2 969 650 | 1 040 590 | 135 820 | 5 582 710 |
| 2009 | 1 416 330 | 3 084 830 | 1 108 740 | 144 990 | 5 754 890 |
| 2010 | 1 391 660 | 3 210 440 | 1 167 800 | 152 820 | 5 922 720 |
| 2011 | 1 372 720 | 3 340 860 | 1 236 470 | 159 680 | 6 109 730 |
| 2012 | 1 346 180 | 3 458 930 | 1 309 920 | 168 790 | 6 283 830 |
| 2013 | 1 327 870 | 3 591 820 | 1 393 780 | 182 940 | 6 496 410 |
| 2014 | 1 306 330 | 3 711 190 | 1 487 260 | 190 490 | 6 695 270 |
| 2015 | 1 279 170 | 3 838 540 | 1 567 920 | 188 550 | 6 874 170 |
| 2016 | 1 251 110 | 3 960 620 | 1 663 680 | 194 220 | 7 069 630 |
| 2017 | 1 225 360 | 4 064 740 | 1 799 650 | 226 280 | 7 316 030 |
| 2018 | 1 202 230 | 4 206 730 | 1 972 840 | 279 280 | 7 661 080 |
| 2019 | 1 163 530 | 4 343 590 | 2 143 010 | 368 720 | 8 018 850 |
| 2020 | 1 141 140 | 4 413 450 | 2 209 760 | 383 520 | 8 147 870 |
| 2021 | 1 110 790 | 4 501 100 | 2 278 510 | 550 370 | 8 440 780 |
| 2022 | 1 081 440 | 4 666 900 | 2 349 240 | 984 410 | 9 081 990 |
| 2023 | 1 051 040 | 4 811 070 | 2 374 220 | 1 585 930 | 9 822 260 |
| Total des déclarants | 2 047 030 | 6 041 480 | 2 647 430 | 2 753 640 | ... n'ayant pas lieu de figurer |
| Total des non‑déclarants | 2 046 620 | 1 307 380 | 159 330 | 4 244 340 | ... n'ayant pas lieu de figurer |
| pourcentage | |||||
| Pourcentage de déclarants | 50,0 | 82,2 | 94,3 | 39,3 | ... n'ayant pas lieu de figurer |
Le graphique 7 montre que la proportion des résidents permanents qui étaient résidents non permanents avant leur admission, par année, varie de 22,6 %, le plus bas niveau pour l’année d’imposition 1983, à 33,6 %, niveau le plus élevé correspondant à l’année d’imposition de 2021.

Tableau de données du graphique 7
| Année d'imposition | Pourcentage |
|---|---|
| Source : Statistique Canada, Base de données longitudinales sur l'immigration, 2024. | |
| 1982 | 22,8 |
| 1983 | 22,6 |
| 1984 | 23,3 |
| 1985 | 24,2 |
| 1986 | 26,0 |
| 1987 | 27,6 |
| 1988 | 28,3 |
| 1989 | 29,8 |
| 1990 | 29,5 |
| 1991 | 30,0 |
| 1992 | 29,9 |
| 1993 | 28,9 |
| 1994 | 27,9 |
| 1995 | 27,2 |
| 1996 | 26,5 |
| 1997 | 25,7 |
| 1998 | 25,3 |
| 1999 | 25,1 |
| 2000 | 24,8 |
| 2001 | 24,8 |
| 2002 | 24,7 |
| 2003 | 24,6 |
| 2004 | 24,6 |
| 2005 | 24,5 |
| 2006 | 24,7 |
| 2007 | 25,3 |
| 2008 | 25,9 |
| 2009 | 26,4 |
| 2010 | 26,7 |
| 2011 | 27,0 |
| 2012 | 27,5 |
| 2013 | 28,0 |
| 2014 | 28,6 |
| 2015 | 29,0 |
| 2016 | 29,6 |
| 2017 | 30,7 |
| 2018 | 31,9 |
| 2019 | 33,0 |
| 2020 | 33,4 |
| 2021 | 33,6 |
| 2022 | 33,5 |
| 2023 | 33,0 |
Un immigrant qui produit une déclaration de revenus pour une année donnée n’en produira pas nécessairement l’année suivante. Si une personne A, par exemple, a été admise en 1983, elle peut figurer dans les fichiers de données fiscales de 1984 à 1999, mais pas dans le fichier de 2000, et y figurer ensuite à nouveau de 2001 à 2013. Ainsi, des fichiers de données fiscales étaient disponibles tous les ans pour 24,8 % des déclarants de la cohorte de 1980. Une émigration externe, un décès ou un retard de déclaration peut expliquer, en outre, que des immigrants déclarants aient pu ne plus produire de déclaration de revenus ou ne pas en produire certaines années.
La plupart des immigrants déclarent leurs revenus pour la première fois l’année de leur admission ou l’année précédente ou suivante. Ainsi, sur les 251 120 immigrants admis en 2006, 100 490 (40,0 %) ont produit une déclaration de revenus pour la première fois en 2006, alors que 15 560 (6,2 %) l’ont fait en 2007 et 3 190 (1,3 %) en 2015.
7.5 Évaluation de la qualité de la données sur l’immigration
7.5.1 Évaluation de la qualité du Fichier intégré des résidents permanents et non permanents (FRPN)
Le contenu du FRPN (PNRF_1980_2024) a été évalué. Alors que la collecte des données fiscales et relatives à l’admission est obligatoire pour les personnes dans le champ d’enquête, ces dernières peuvent ne pas remplir tous les champs. Ces champs ont pu être laissés vides parce que le répondant ne connaissait pas la réponse ou pour d’autres raisons, que les utilisateurs des données ne peuvent connaître (p. ex. refus) (McLeish, 2011). L’absence de réponse à certaines questions peut présenter des problèmes lorsque la BDIM est utilisée à des fins statistiques, notamment dans les cas suivants :
- Si l’utilisateur de la base de données souhaite produire un échantillon fondé sur les caractéristiques pour lesquelles des enregistrements manquent, une erreur de couverture peut survenir (c.-à-d. les personnes incluses dans la base d’échantillon peuvent ne pas être représentatives de la population cible).
- S’il s’agit d’une absence de données informatives (p. ex. l’absence du renseignement n’est pas un cas aléatoire; l’absence de réponse indique ce que la réponse aurait été), toute analyse utilisant ces variables serait biaisée.
On a évalué la présence de variables manquantes et de valeurs non valides. Les chiffres présentés dans cette section sont arrondis. Les valeurs non valides sont soit incohérentes soit elles ne figurent pas dans les tableaux de métadonnées à la disposition des utilisateurs (voir la composante sur l’immigration du dictionnaire de données en annexe). La plupart des problèmes de qualité figurant dans le tableau 8 concernent des données recueillies dans les années 1980 et 1990. Il convient de souligner que des valeurs semblant valides peuvent également être erronées.
La variable de numéro d’identification du cas (CASE_ID) présente des taux de réponse aux éléments se situant généralement dans la frange supérieure des 90 % (généralement plus de 99 %). Cependant, pour certaines années d’admission, le taux de réponse diminue significativement (jusqu’à 80 % en 1991 et 1992). Par conséquent, toute analyse fondée sur cette variable pour toutes les années d’admission sous-représentera ces années, pour lesquelles le manque de réponse à l’élément est plus élevé (p. ex. 1986, 1987, 1991, 1992, 1993, 2020). Aucune détection des valeurs non valides n’a eu lieu pour la variable de numéro d’identification du cas (CASE_ID).
La variable d’âge à l’admission Landing_age est définie comme non valide lorsqu’elle dépasse 100, même s’il est possible dans certains cas que ces valeurs soient exactes. Il convient de souligner que, selon les valeurs de cette variable, le nombre d’immigrants admis après l’âge de 100 ans était bien plus élevé entre 1987 et 1995 que pour les autres années d’admission. Il pourrait s’agir d’un problème de saisie de données.
Dans le FRPN de la BDIM de 2024, 25 enregistrements présentaient une année de naissance antérieure à 1880 et 15 avaient une année de naissance de 1753 avec une année d’admission après 1985.
Les variables relatives au pays présentent également des problèmes de qualité. Le pays de naissance manque dans certains enregistrements pour pratiquement toutes les années d’admission. Des valeurs manquent, par exemple, pour plus de 100 enregistrements dans chacune des années de 1985 à 1993. Le pays de citoyenneté est manquant pour moins de 20 enregistrements par année d’admission pour la plupart des cohortes (à l’exception des cohortes de 2004, 2005, 2006 et 2007, où plus de 100 valeurs étaient manquantes par année d’admission). Le pays de résidence manque pour de nombreux enregistrements d’admission pour 2011 (cette valeur manque pour 1 810 enregistrements, soit 0,7 % des admissions de cette année‑là), pour 2012 (cette valeur manque pour 5 015 enregistrements, soit 1,9 % des admissions de cette année‑là) et pour 2013 (manquant pour 2 375 enregistrements, soit 0,9 % des admissions de cette année‑là).
Les variables de scolarité avant la cohorte de 2017, après imputation (voir la section 6.3) présentent plus de 150 valeurs manquantes par année d’admission de 1980 à 1984; cela équivaut à un taux de valeurs manquantes par année d’admission de moins de 0,5 %. Une nouvelle variable a été dérivée en utilisant les données d’entrée express pour imputer le niveau de scolarité des personnes admises entre 2015 et 2020.
Le pourcentage de réponses valides pour les variables de profession est plus de 99 % pour toutes les années d’admission.
Les variables de statut dans la famille Family_Status et d'immigrants sélectionnés par le Québec CSQ_IND ont la plupart de leurs valeurs manquants pour les enregistrements des années d’admission antérieures à 1999.
La variable de langue maternelle Mother_Tongue manque pour quelques centaines d'enregistrements entre les années d'admission 1990 et 1995.
La langue officielle Official_Language a un nombre croissant de valeurs manquantes ; 2016 à 2023, entre 1 820 et 10 815 par cohorte ont une valeur manquante.
La variable de l’état matrimonial Marital_Status a eu plus de 200 valeurs manquantes par cohorte depuis 2012.
Les variables Destination_CD, Destination_CMA, Destination_CSD et Destination_Province ont moins de valeurs manquantes dans la BDIM 2023 que lors des années précédentes suite à la mise à jour avec la Classification Géographique Type (CGT) de 2016.
Les variables d’année et de mois de décès manquent ou incohérents pour certaines personnes reconnues comme décédées (Death_Indicator=1). La valeur « 9999 » a été attribuée à la variable d’année de décès Death_Year et la valeur « 99 » à celle du mois de décès Death_Month dans les cas où l’année et le mois de décès étaient inconnus ou incohérents .
| Variables du PNRF | Résponses valides | Champs vides | Résponses non valides | |||
|---|---|---|---|---|---|---|
| nombre | pourcentage | nombre | pourcentage | nombre | pourcentage | |
| Notes : FRPN: Fichier intégré des résidents permanents et non permanents. RNP: Résident non permanent. Seules les variables ayant des valeurs manquantes ou invalides ont été incluses dans ce tableau. Tous les chiffres sont arrondis.
Source : Statistique Canada, Base de données longitudinales sur l’immigration 2024. |
||||||
| Case_ID | 10 455 100 | 98,28 | 182 980 | 1,72 | 0 | 0,00 |
| Landing_age | 10 636 970 | 99,99 | 380 | 0,00 | 730 | 0,01 |
| Birth_Year | 10 637 880 | 100,00 | 180 | 0,00 | 20 | 0,00 |
| Gender | 10 638 080 | 100,00 | 0 | 0,00 | 0 | 0,00 |
| Country_Birth | 10 635 200 | 99,97 | 2 880 | 0,03 | 0 | 0,00 |
| Country_Citizenship | 10 636 560 | 99,99 | 1 520 | 0,01 | 0 | 0,00 |
| Country_Residence | 10 624 690 | 99,87 | 13 390 | 0,13 | 0 | 0,00 |
| Education_Qualification | 9 682 680 | 91,02 | 955 400 | 8,98 | 0 | 0,00 |
| Level_of_Education | 10 635 000 | 99,98 | 1 670 | 0,02 | 0 | 0,00 |
| Years_of_Schooling | 10 634 210 | 99,98 | 2 460 | 0,02 | 0 | 0,00 |
| Education_Derived | 10 127 590 | 95,20 | 510 490 | 4,80 | 0 | 0,00 |
| Landing_age_6_groups | 10 637 700 | 100,00 | 380 | 0,00 | 0 | 0,00 |
| Landing_age_9_groups | 10 637 700 | 100,00 | 380 | 0,00 | 0 | 0,00 |
| Occupation_CD | 10 630 530 | 99,93 | 7 550 | 0,07 | 0 | 0,00 |
| NOC5-NOC2 | 10 582 050 | 99,47 | 56 030 | 0,53 | 0 | 0,00 |
| Skill_level_CD21 | 10 630 520 | 99,93 | 7 560 | 0,07 | 0 | 0,00 |
| Family_Status | 10 635 490 | 99,98 | 2 590 | 0,02 | 0 | 0,00 |
| Family_Status_rollup | 10 635 490 | 99,98 | 2 590 | 0,02 | 0 | 0,00 |
| Marital_status | 10 631 810 | 99,94 | 6 270 | 0,06 | 0 | 0,00 |
| Marital_status_rollup | 10 631 810 | 99,94 | 6 270 | 0,06 | 0 | 0,00 |
| Mother_Tongue | 10 635 970 | 99,98 | 2 110 | 0,02 | 0 | 0,00 |
| Official_Language | 10 579 990 | 99,45 | 58 090 | 0,55 | 0 | 0,00 |
| Special_Program | 2 295 360 | 21,58 | 8 342 720 | 78,42 | 0 | 0,00 |
| CSQ_ind | 10 637 850 | 100,00 | 230 | 0,00 | 0 | 0,00 |
| Destination_CD | 10 637 710 | 100,00 | 370 | 0,00 | 0 | 0,00 |
| Destination_CMA | 10 637 710 | 100,00 | 370 | 0,00 | 0 | 0,00 |
| Destination_CSD | 10 637 710 | 100,00 | 370 | 0,00 | 0 | 0,00 |
| Destination_Province | 10 637 710 | 100,00 | 370 | 0,00 | 0 | 0,00 |
| Permits and NPR-specific variables | 3 026 840 | 100,00 | 0 | 0,00 | 0 | 0,00 |
| Death_Year | 10 637 420 | 99,99 | 660 | 0,01 | 0 | 0,00 |
| Death_Month | 10 637 370 | 99,99 | 710 | 0,01 | 0 | 0,00 |
7.5.2 Évaluation de la qualité du Fichier des résidents non permanents (FRN)
Une validation du contenu des fichiers NRF_PERMIT_1980_2024 et NRF_PERSON_1980_2024 a été effectuée. Ces fichiers contiennent des ensembles de variables différents les uns des autres. Dans le tableau 8B, les variables "Landing_Year" à « Number_All_Permits » apparaissent dans le fichier des personnes, tandis que les autres apparaissent dans le fichier des permis. Alors que la collecte des données fiscales et relatives à l’admission est obligatoire pour les personnes dans le champ d’enquête, ces dernières peuvent ne pas remplir tous les champs. Ces champs ont pu être laissés vides parce que le répondant ne connaissait pas la réponse ou pour d’autres raisons, que les utilisateurs des données ne peuvent connaître (p. ex. refus) (McLeish 2011). L’absence de réponse à certaines questions peut présenter des problèmes lorsque la BDIM est utilisée à des fins statistiques, notamment dans les cas suivants :
- Si l’utilisateur de la base de données souhaite produire un échantillon fondé sur les caractéristiques pour lesquelles des enregistrements manquent, une erreur de couverture peut survenir (c.-à-d. les personnes incluses dans la base d’échantillon peuvent ne pas être représentatives de la population cible).
- S’il s’agit d’une absence de données informatives (p. ex. l’absence du renseignement n’est pas un cas aléatoire; l’absence de réponse indique ce que la réponse aurait été), toute analyse utilisant ces variables serait biaisée.
La présence de variables manquantes et de valeurs non valides a été évaluée. Les chiffres présentés dans cette section sont arrondis. Les valeurs non valides sont soit incohérentes, soit non répertoriées dans les tableaux de métadonnées mis à la disposition des utilisateurs (voir la composante immigration de l'annexe du dictionnaire des données). Il convient de noter que certaines valeurs apparemment valides peuvent également être erronées.
La variable Landing_year présente un pourcentage élevé de valeurs manquantes (72,1 %). Ceci est normal puisque seuls les immigrants admis ont une année d’admission et que la NRF inclut tous les résidents non permanents, qu'ils soient devenus résidents permanents ou non.
Dans le fichier NRF_PERSON de la BDIM 2023, 260 enregistrements ont une année de naissance antérieure à 1880, et 250 enregistrements ont une année de naissance antérieure à 1753.
Alors que la plupart des enregistrements ont un pays de naissance (Country_Birth), ceux dont le pays de naissance est manquant ont également une année d'admission manquante.
Les variables Effective_Date et Valid_Date n'ont pas de réponses invalides en elles-mêmes, mais lorsqu'elles sont comparées ensemble, elles peuvent produire des réponses invalides. Par exemple, la Valid_Date doit toujours arriver après la Effective_Date. Les enregistrements dont la date de validité apparaît avant la date d'entrée en vigueur peuvent être considérés comme des réponses non valides pour l'une de ces variables ou les deux. De plus, tout enregistrement dont la durée entre Effective_Date et la Valid_Date est de 5 ans ou plus peut être considéré comme suspect et comprenant probablement une valeur non valide pour une des deux variables. 0,05 % des comparaisons entre les variables Effective_Date et Valid_Date pourraient être considérées comme non valides en raison de ces deux problèmes.
Plus de 99 % des valeurs manquantes de la variable Valid_Date se produisent lorsque la variable Document_Type est 46 (demande d'asile), ce qui s'explique par le fait qu'aucune date de fin n'est attribuée aux demandes d'asile.
Les variables Destination_CD, Destination_ER, Destination_CMA, Destination_CSD et Destination_province présentent une proportion de valeurs manquantes plus faible que les autres variables, mais beaucoup plus importante que le dans le fichier PNRF. La plupart des années avant 2004 (sur la base de la variable Effective_Date) ont un taux de variables manquantes très faible, autour de 1%. Cependant, l'année 1989 a un taux de variables manquantes de près de 12 %. Après 2004, le taux manquant fluctue entre 2 % et 13 %. La BDIM 2023 utilise la Classification géographique standard (CGS) pour mettre à jour la région et le code géographiques.
| Variables du NRF | Résponses valides | Champs vides | Résponses non valides | |||
|---|---|---|---|---|---|---|
| nombre | pourcentage | nombre | pourcentage | nombre | pourcentage | |
| Notes : NPR : résident non permanent. Seules les variables dont les valeurs sont manquantes ou invalides ont été incluses dans le tableau. Tous les chiffres sont arrondis. Les variables Effective_Date et Valid_Date peuvent être invalides lorsqu'elles sont comparées entre elles. Voir le paragraphe de la section 7.5.2 pour plus de détails. Source : Statistique Canada, Base de données longitudinales sur l’immigration 2024. |
||||||
| Landing Year | 3 026 840 | 27,94 | 7 806 890 | 72,06 | 0 | 0,00 |
| birth_year | 10 832 160 | 99,99 | 1 320 | 0,01 | 260 | 0,00 |
| birth_month | 10 832 360 | 99,99 | 1 370 | 0,01 | 0 | 0,00 |
| gender | 10 833 730 | 100,00 | 0 | 0,00 | 0 | 0,00 |
| COUNTRY_BIRTH | 10 815 840 | 99,83 | 17 890 | 0,17 | 0 | 0,00 |
| NUMBER_OTHER_PERMITS | 10 833 730 | 100,00 | 0 | 0,00 | 0 | 0,00 |
| NUMBER_REFUGEE_CLAIMS | 10 833 730 | 100,00 | 0 | 0,00 | 0 | 0,00 |
| NUMBER_WORK_PERMITS | 10 833 730 | 100,00 | 0 | 0,00 | 0 | 0,00 |
| NUMBER_STUDY_PERMITS | 10 833 730 | 100,00 | 0 | 0,00 | 0 | 0,00 |
| NUMBER_ALL_PERMITS | 10 833 730 | 100,00 | 0 | 0,00 | 0 | 0,00 |
| COUNTRY_RESIDENCE | 24 579 570 | 95,58 | 1 137 450 | 0,04 | 0 | 0,00 |
| COUNTRY_CITIZENSHIP | 25 671 780 | 99,82 | 45 230 | 0,00 | 0 | 0,00 |
| LEVEL_OF_STUDY_ROLLUP | 9 116 510 | 35,45 | 16 600 500 | 64,55 | 0 | 0,00 |
| LEVEL_OF_STUDY | 9 116 510 | 35,45 | 16 600 500 | 64,55 | 0 | 0,00 |
| SKILL_LEVEL_CD21 | 16 874 530 | 65,62 | 8 842 480 | 34,38 | 0 | 0,00 |
| OCCUPATION_CD | 16 879 190 | 65,63 | 8 837 820 | 34,37 | 0 | 0,00 |
| NOC5_CD11 | 17 608 930 | 68,47 | 8 108 080 | 31,53 | 0 | 0,00 |
| NOC4_CD11 | 17 608 930 | 68,47 | 8 108 080 | 31,53 | 0 | 0,00 |
| NOC3_CD11 | 17 608 930 | 68,47 | 8 108 080 | 31,53 | 0 | 0,00 |
| NOC2_CD11 | 17 608 930 | 68,47 | 8 108 080 | 31,53 | 0 | 0,00 |
| DESTINATION_CSD | 24 274 020 | 94,39 | 1 442 990 | 5,61 | 0 | 0,00 |
| DESTINATION_CMA | 24 274 020 | 94,39 | 1 442 990 | 5,61 | 0 | 0,00 |
| DESTINATION_PROVINCE | 24 274 020 | 94,39 | 1 442 990 | 5,61 | 0 | 0,00 |
| DESTINATION_CD | 24 274 020 | 94,39 | 1 442 990 | 5,61 | 0 | 0,00 |
| DESTINATION_ER | 24 274 020 | 94,39 | 1 442 990 | 5,61 | 0 | 0,00 |
| effective_date | 25 717 010 | 100,00 | 0 | 0,00 | 0 | 0,00 |
| valid_date | 24 350 730 | 94,69 | 1 366 280 | 5,31 | 0 | 0,00 |
| DOCUMENT_TYPE | 25 717 010 | 100,00 | 0 | 0,00 | 0 | 0,00 |
| SPECIAL_PROGRAM | 5 835 000 | 22,69 | 19 882 010 | 77,31 | 0 | 0,00 |
| CLASSIFICATION_ID | 10 365 640 | 41,21 | 14 789 780 | 58,79 | 0 | 0,00 |
| LMIA_EXEMPTIONS | 11 443 610 | 44,50 | 14 273 400 | 55,50 | 0 | 0,00 |
7.6 Évaluation de la qualité de la variable de la province de résidence (PRCO_)
Une validation des variables géographiques incluses dans les fichiers fiscaux de la BDIM a été effectuée. Cette section explique comment la variable Province de résidence (PRCO_) a été dérivée et sa qualité.
La province de résidence (PRCO_) est fondée sur les renseignements fournis par les déclarants, lorsque disponible. Les renseignements manquants pour la province de résidence sont remplacés par les renseignements recueillis sur le code postal de l'adresse postale de l’individu (PSCO_I), si disponible, sinon celui de la famille est utilisé (PSCO_F).
| PRCO | Province et Territoires | Premier caractère du code postal (PSCO) |
|---|---|---|
| Note: Les valeurs de certain codes postales sont U ou F pour les valeurs manquantes, respectivement États‑Unis est U et, étranger est marqué par F. | ||
| 0 | Terre‑Neuve‑et‑Labrador | A |
| 2 | Île‑du‑Prince‑Édouard | B |
| 1 | Nouvelle‑Écosse | C |
| 3 | Nouveau‑Brunswick | E |
| 4 | Québec | G, H, J |
| 5 | Ontario | K, L, M, N ,P |
| 6 | Manitoba | R |
| 7 | Saskatchewan | S |
| 8 | Alberta | T |
| 9 | Colombie‑Britannique | V |
| 10 | Territoires du Nord‑Ouest | X |
| 11 | Yukon | Y |
| 12 | Non‑résidents manquant | manquant |
| 14 | Nunavut | X |
Bien que la province de résidence (PRCO_) soit plus fiable que la province d’imposition (TXPCO_), certaines anomalies ont été observées principalement sur le code des non-résidents dans les déclarations des années d’imposition 1989, 1993 et 1998. Celles-ci peuvent avoir une incidence sur certaines provinces.
Pour l’année d’imposition 1993, la IMDB_T1FF comprend des anomalies pour la province du Manitoba qui compte un nombre inhabituel de résidents (48 130 en 1993, comparativement à 33 650 l'année d'imposition précédente et à 37 365 l'année d'imposition suivante). Des changements semblables sont observés dans les Territoires du Nord-Ouest. De plus, 740 personnes sont codées comme résidant au Nunavut alors que le Nunavut a été créé en 1998. 725 personnes sont codées comme résidant dans plusieurs juridictions. Les utilisateurs peuvent utiliser l'information de la variable PSCO_F pour diminuer l'effet des anomalies sur leurs analyses qui incluent la province de résidence. Toutefois, comme nous l'avons indiqué plus haut, le moment est différent entre PSCO (basé sur le lieu de résidence lors de la transmission de la déclaration) et PRCO_ (lieu de résidence au 31 décembre).
Les enregistrements des non-résidents (PRCO_=12) semblent surestimés dans le fichier IMDB_T1FF de 1989. Il comprend 79 210 non-résidents du Canada, dont bon nombre ont un statut de résident non permanent. Les utilisateurs peuvent décider d'utiliser le code postal de l'adresse postale (PSCO_ au niveau individuel ou familial) pour calculer la valeur du PRCO_ ou retirer les non-résidents de leur analyse.
Dans le fichier FFT1 de la BDIM de 1998, IMDB_T1FF_1998, un nombre plus élevé que prévu d'enregistrements est attribué à Terre-Neuve-et-Labrador (PRCO_). Dans ces cas, le lieu de résidence de la famille au moment du dépôt de la demande est également Terre-Neuve selon la variable PSCO_F.
- Date de modification :