Projections linguistiques pour le Canada, 2011 à 2036
Chapitre 1. Éléments de contexte et de méthodologie

1.1 Ce que les projections peuvent nous apprendre, ce qu'elles ne permettent pas de savoir

L'analyse de l'évolution des caractéristiques et des pratiques linguistiques au Canada au cours des 25 dernières années peut-elle fournir un aperçu de leur évolution possible en la matière d'ici 2036? Si l'on répondait par l'affirmative, cela supposerait d’une part que nous avons une compréhension globale et complète des facteurs qui influencent ou influenceront cette évolution et, d’autre part, que les tendances démolinguistiques passées et les mécanismes qui les ont produites sont garantes du portrait linguistique futur de la population. Or, ce n'est pas tout à fait le cas. Bien entendu, dans le domaine de la démographie et de la démolinguistique en particulier, il est généralement possible de bien comprendre les interrelations entre les phénomènes sous-jacents à l'évolution démographique d'une société. Il est également possible d'expliquer les grands processus qui exercent un effet sur la structure des populations. L'accroissement naturel (les naissances moins les décès), les migrations internationales, inter- et intraprovinciale, la mobilité linguistique intra- et intergénérationnelle sont tous des facteurs qui nous permettent d'expliquer l'évolution des communautés ou des groupes linguistiques.

Lachapelle et Henripin (1980, p.248) désignaient par le terme de « futur déterminé » des projections à visée scientifique effectuées à partir du passé démographique d'une population susceptible de « contraindre l’avenir ». Or, bien qu'il soit possible, à partir d'une structure de population initiale connue, d'appliquer un certain nombre d'hypothèses de « mobilité » ou de « transitions », au sens large, rien n'assure que ces « transitions » se reproduiront de la même façon dans l'avenir. Certes, plusieurs transitions ou événements démographiques sont relativement stables ou évoluent à un rythme lent (par ex. les taux de transmission d’une langue ou la mortalité). D’autres, cependant, sont plus volatiles et entachés d’incertitudes et peuvent par conséquent rendre particulièrement difficile de prévoir l'évolution d'une population à court et à moyen terme.

Ces phénomènes changeants, dans la mesure où ils sont susceptibles d’affecter le devenir démographique des populations projetées, requièrent pour leur projection le développement d’hypothèses multiples. La mobilité géographique (internationale ou intranationale) des populations en est un exemple. Elle est en effet sensible à divers effets de conjoncture économique et, ce faisant, peut influencer des phénomènes démolinguistiques comme la mobilité linguistique inter- et intragénérationnelle nette. L'action et les décisions politiques peuvent également influencer l'évolution de certains facteurs démographiques; l'identification de seuils nationaux en matière d'immigration, d’accueil des réfugiés, les changements dans les politiques d'immigration ou les politiques familiales en sont de bons exemplesNote 1.

Cela dit, et comme le souligne Termote (2011, p.62), malgré ces variations conjoncturelles, dans plusieurs cas les tendances démographiques sont particulièrement lourdes et difficiles à renverser en raison du poids du passé et du fait que la structure initiale d’une population exerce souvent une grande force d’inertie. C'est notamment le cas lorsqu'on examine comment la structure par âge d'un groupe linguistique donné risque d'influencer les modèles de migration future de ce groupe, les populations plus âgées étant, par exemple, moins susceptibles de migrer.

Notre étude présente des résultats de projections et non pas des prédictions démographiques (voir l'étude « Immigration et diversité : projections de la population du Canada et de ses régions, 2011 à 2036 », Statistique Canada, 2017a). Cela tient au fait qu'il n'est pas en notre pouvoir de prévoir l'avenir démolinguistique de la population canadienne, voire d'une province en particulier. Ces projections, comme nous le verrons plus loin, permettent plutôt d'examiner et de mettre en lumière à quoi ressemblerait le futur démolinguistique si les hypothèses et les scénarios élaborés devaient se réaliser. Par exemple, on ne peut savoir si la fécondité augmentera dans l'avenir et, le cas échéant, de combien serait cette hausse. On ne sait pas non plus combien de nouveaux immigrants le Canada accueillera dans 20 ans, ni comment seront distribués ces immigrants à travers le pays. Cela dit, selon les hypothèses choisies (faible ou forte fécondité, faible ou forte migration, même ou différente composition de l'immigration, etc.) et les scénarios examinés (combinaisons des hypothèses), il est donc possible de présenter une fourchette plausible d’évolution de la situation ainsi que les facteurs susceptibles de l'influencer et de quantifier la sensibilité de cette évolution aux différents scénarios.

1.2 Exercices antérieurs de projections linguistiques

Contrairement aux travaux réalisés en matière de projections démographiques, somme toute assez peu de travaux ont été menés en matière de projections démolinguistiques dans le passé. Termote fait exception à ce constat, ayant mené pas moins de cinq exercices prospectifs en près de 20 ans (1994, 1996, 1999, 2008, 2011) à partir des recensements de 1986, 1991, 1996, 2001 et 2006.

Bien que Maheux (1968) ainsi que Charbonneau, Henripin et Légaré (1973) se soient prêtés à quelques études prospectives sur la population francophone du Canada et du Québec en particulier, Lachapelle et Henripin (1980) ont été les premiers à diffuser des résultats de projections démolinguistiques pour l’ensemble du pays. En raison des données sur la langue disponibles et des moyens informatiques très limités de l'époque, ces derniers n'ont pu bénéficier, outre les données des recensements sur la langue maternelle, que des informations sur la langue d'usage au foyer au recensement de 1971. Ainsi, la structure démographique initiale projetée se limitait à 4 variables : l'âge, la région, la langue maternelle et la langue d'usage. De plus, trois régions avaient été choisies, soit Montréal, le Québec hors Montréal et le Canada hors Québec.

Termote et Gauvreau (1988) se sont quant à eux prêtés à des projections démolinguistiques sur l'ensemble du Québec et ses régions en utilisant les données sur la langue d'usage aux recensements de 1971 et 1981, une question sur la langue parlée à la maison n'ayant pas été posée au recensement de 1976. De plus, ces auteurs s'appuyaient alors sur une structure initiale caractérisée par une période exceptionnelle en matière de migration interprovinciale, comme nous le verrons plus loin dans notre étude.

Avant la diffusion des premiers travaux prévisionnels de Termote en 1994, trois autres exercices prévisionnels furent menés sur la région de Montréal (Benjamin et Baillargeon, 1977; Veltman, 1989; Paillé, 1990). Parmi eux, notons que Veltman a examiné un grand nombre d'hypothèses en matière de mobilité linguistique qui ont démontré l'influence relative limitée du phénomène. Quant aux travaux de Paillé, ceux-ci ont porté essentiellement sur l'évolution de la population de langue maternelle française sur l'île de Montréal.

Alors que tous ces travaux ont été menés en adoptant un modèle traditionnel de projection fonctionnant sur la base de données agrégées (modèle par cohortes et composantes), Sabourin et Bélanger (2014, 2015) ont plutôt utilisé une approche par microsimulation. S'appuyant sur les travaux de Bélanger et Caron-Malenfant (2005) et Caron-Malenfant, Lebel et Martel (2010) et prenant comme structure initiale la population lors du recensement de 2006, ils ont ainsi projeté la langue maternelle et la langue parlée le plus souvent à la maison en utilisant un certain nombre d'hypothèses et de scénarios en matière de fécondité, de mortalité, de migration interne et internationale et de transferts linguistiques intra- et intergénérationnelsNote 2.

1.3 Projeter quoi, projeter qui? Quelles caractéristiques linguistiques projetées?

Tout exercice de projections en matière de langue au Canada repose sur un certain nombre d'hypothèses, d'axiomes et de suppositions. Projeter l'évolution des caractéristiques et des pratiques linguistiques, voire de la situation linguistique, à partir de données censitaires ou, dans le cas de notre étude, de données de l'Enquête nationale auprès des ménages (ENM) de 2011, nous force d'entrée de jeu à reconnaître que ces projections sont nécessairement limitées par l'information qui y est disponible sur le sujet, pourtant déjà très riche au Canada en regard des pratiques internationales. Non seulement le recensement canadien (ou l'ENM de 2011) comprend-il sept questions ou sous-questions sur la langue, mais en matière de statistiques linguistiques, le Canada est l’un des rares pays du monde à recueillir de l’information sur chacun des « domaines » recommandés par les Nations Unies dans le cadre d'un recensement : « a) la langue maternelle, b) la langue habituelle (définie comme la langue parlée habituellement ou le plus souvent au foyer) et c) l'aptitude à parler une ou plusieurs langues déterminées » (Nations Unies, 2009)Note 3.

Dans le recensement et l'ENM de 2011, la question sur la langue maternelle, qui est demeurée à peu près la même depuis le recensement de 1941, était libellée ainsi :

« Quelle est la langue que cette personne a apprise en premier lieu à la maison dans son enfance et qu’elle comprend encore? Si cette personne ne comprend plus la première langue apprise, indiquez la seconde langue qu’elle a apprise. »

La question sur la langue parlée le plus souvent à la maison était libellée comme suit en 2011 :

« Quelle langue cette personne parle-t-elle le plus souvent à la maison? »

Quant à la question relative à la connaissance du français et de l’anglais, celle-ci a peu varié depuis le recensement de 1971. En 2011, elle était formulée comme suit :

« Cette personne connaît-elle assez bien le français ou l’anglais pour soutenir une conversation? »

Quatre possibilités de réponse sont offertes : français seulement; anglais seulement; français et anglais; enfin ni français ni anglais. Il s’agit d’une question subjective dont la réponse est laissée à l’appréciation des recensés, sans doute dans beaucoup de cas à la personne dans le ménage qui remplit le questionnaire pour tous.

Malgré cette abondance de statistiques sur le sujet au Canada, le fait de disposer de données sur, par exemple, les langues utilisées au travail (principales ou secondaires) ou sur l'utilisation secondaire d'une ou de plusieurs langues à la maison ne permet pas forcément de les utiliser à des fins de projection. Il en irait de même si nous disposions de données détaillées sur l’utilisation des langues dans l’espace public (dans les commerces, les services à la population, etc.). Cela tient notamment à la complexité de les intégrer à un modèle de projection qui repose sur une multitude de facteurs et de caractéristiques qui interagissent les uns avec les autres. En d’autres termes, le nombre de transitions interdépendantes est généralement le principal facteur qui pose problème ainsi que la disponibilité de données sur chacune de ces transitionsNote 4. Par exemple, pour projeter l'utilisation secondaire d'une langue à la maison, il faudrait d'abord mieux comprendre l'ensemble des facteurs et des conditions qui font en sorte qu'un individu commence à parler (ou cesse de parler) cette langue de façon secondaire et être en mesure de modéliser et de projeter chacun de ces facteurs qui interagissent possiblement les uns avec les autres. Ces facteurs pourraient en effet comprendre l'utilisation des langues à l'extérieur du foyer (au travail, à l'école, avec les amis, etc.), le fait de migrer d'une province à l'autre, le fait de changer d'emploi, le fait de rencontrer un conjoint, le fait de parler cette langue de façon secondaire avant d'immigrer au Canada, etc. Il faut ajouter à cela le fait que nous faisons également face à une évolution difficilement prévisible et assez variable des déclarations multiples au regard de ces pratiques dans le tempsNote 5. Finalement, dans le cas de la (ou des) langue(s) utilisée(s) au travail dans les zones de contacts interlinguistiques, celle(s)-ci est (sont) généralement associée(s) à des caractéristiques spécifiques des secteurs d'industrie et des professions, information très difficile à projeter et non disponible dans le modèle de microsimulation DemosimNote 6.

Face à notre question de départ, à savoir ce que nous projetons, il serait prétentieux de croire que nous pouvons, à partir de la structure initiale utilisée et des transitions considérées, projeter l’ensemble de la « situation linguistique » à l'horizon de 2036. La « situation linguistique » sous-entend en effet un ensemble de dynamiques et de rapports interlinguistiques complexes qui ne peut être complètement pris en compte par des données censitaires ou d'enquêtes à grande échelle. Il en va de même avec l'idée de savoir qui nous projetons. À cet égard, le choix des termes et des critères utilisés pour définir les groupes ou les collectivités linguistiques comprend toujours une part d'arbitraire. Leur utilisation doit donc nécessairement prendre en compte le fait que, dans leur acception normative, ils ne sont pas complètement neutres ni ne permettent de saisir toute la complexité de la réalité qu'ils prétendent cerner.

Dans notre étude, nous utilisons à maintes reprises la notion de groupe linguistique. Cette notion polysémique comporte nécessairement des limites bien qu'elle ait un caractère heuristique. On parlera, par exemple, de l'ensemble des personnes ayant déclaré la même langue maternelle et qui résident sur un territoire donné, comme constituant un groupe linguistique spécifique en raison de cette caractéristique commune. Il en va de même si l'on utilise plutôt le critère de la langue parlée le plus souvent (principale langue d'usage) à la maison, voire celui de la première langue officielle parlée, dont nous traiterons ci-après. D'aucuns pourraient préférer définir un groupe en fonction de l'utilisation prédominante d'une langue dans l'espace public, voire même en fonction de la capacité de soutenir une conversation dans une langue donnée. C'est du reste le critère utilisé par l'Organisation internationale de la francophonie (OIF) pour définir les collectivités francophones de la planèteNote 7.

Lachapelle (1991) définit un groupe linguistique comme un groupement d'êtres humains présentant entre eux certaines affinités linguistiques. Nous pourrions également parler d'un ensemble de personnes qui partagent certaines caractéristiques spécifiques associées à la langue ou à une langue en particulier. Or, nous savons que ces « affinités linguistiques »Note 8 peuvent reposer sur une multitude de critères démographiques, sociologiques, politiques, culturels, etc.

Dans certains cas, et aux fins de simplification, des groupes seront même définis en fonction de critères qu'ils ne partagent pas avec d'autres collectivités. Par exemple, un nombre croissant de personnes ont en commun le fait de ne pas avoir le français ni l'anglais, langues officielles du pays, comme langue maternelle ou comme principale langue d'usage au foyer. En ce sens, la seule affinité linguistique, si l'on peut dire, qu'ils partagent entre eux est le fait de ne pas avoir une langue maternelle ou d'usage au foyer française ou anglaise. Lorsque l'accent est mis sur le français ou l'anglais, et en raison du fait que près de 200 langues différentes sont déclarées au recensement, il a généralement été de pratique courante de les regrouper ensemble sous le vocable de « langues non officielles ». En français, le terme « langue tierce » est de plus en plus utilisé pour désigner les langues autres que le français ou l'anglais. Ce groupe de langues englobe à la fois les langues autochtones et les langues dites immigrantesNote 9.

S'agissant des termes « francophone » et « anglophone », le terme « allophone » est également largement utilisé, en particulier au Québec, pour désigner ce tiers groupe linguistique. Ce terme a été créé dans le cadre de la Commission d'enquête sur la situation de la langue française et sur les droits linguistiques au Québec (1968-1972). Tiré des racines grecques allos (« autre ») et phônê (« voix », « son »), ce néologisme désigne habituellement toute personne dont la langue maternelle ou la principale langue d'usage au foyer est autre que le français ou l'anglaisNote 10. Il a par ailleurs progressivement intégré le discours politique, scientifique, voire même vernaculaire, en particulier au Québec, mais il est également perçu par certains comme empreint d'essentialisme (« être » allophone plutôt qu’« être » francophone ou anglophone).

Notre étude évitera donc, à dessein, de parler de communautés ou de groupe francophone ou anglophone, voire allophone. Cela dit, nous parlerons de groupe de langue française, anglaise ou autre (tierce), voire de langues officielles ou non officielles et spécifierons toujours à quel critère ces termes réfèrent. Plus spécifiquement, nous projetons sur l'horizon 2036 les effectifs et les parts relatives des groupes qui auront en commun le français, l'anglais ou une autre langue (langue tierce)Note 11 comme langue maternelle ou comme langue parlée le plus souvent à la maison. Nous projetterons également l'effectif et le pourcentage des populations ayant le français ou l'anglais comme première langue officielle parlée ainsi que les populations capables de soutenir une conversation en français ou en anglais.

1.3.1 Les questions linguistiques utilisées aux fins de projections

Pourquoi projeter les populations selon les critères de la langue maternelle, de la principale langue d'usage à la maison et de la première langue officielle parlée?

Tout d'abord, en raison de leur disponibilité depuis le début du 20e siècle et de leur utilisation plus étendue depuis les années 1960Note 12, les données sur la langue maternelle ont permis d'étudier l'évolution et la situation des différents groupes linguistique au pays. La notion de langue maternelle a en effet été pendant plusieurs années le principal critère utilisé pour désigner les groupes de langue anglaise ou française ou autre au Canada et au Québec en particulier. Ce choix découle de considérations historiques. Non seulement les statistiques fondées sur la langue maternelle ont longtemps eu l’avantage d’être approximativement comparables depuis plus d’un demi-siècle, mais l’article 23 de la Charte des droits et libertés de 1982 utilise le critère de la langue maternelle comme l’une des conditions permettant aux parents d’inscrire leurs enfants à l’école primaire ou secondaire dans la langue de la minorité de langue officielle.

Toutefois, la langue maternelle des individus ne renseigne pas sur leur utilisation des langues. Dans son rapport de 1967, la Commission royale d'enquête sur le bilinguisme et le biculturalisme (Laurendeau-Dunton) déclarait que les données des recensements sur la langue maternelle étaient en retard d’une génération sur les faits et suggérait que l’on recueille de l’information sur la langue habituelle des Canadiens. La Commission souhaitait ainsi qu’on ajoute une question au recensement, laquelle « porterait précisément sur la langue principale de chaque Canadien. Elle permettrait d’apprendre quelle langue il parle le plus, et de façon habituelle, à la maison et au travail »Note 13. Lors du recensement de 1971, Statistique Canada a donné suite à cette suggestion en choisissant d’ajouter une question sur la langue parlée le plus souvent à la maison. Pour l’essentiel, ce choix découlait du fait que, selon la Commission, il serait utile d'obtenir de l’information sur l’utilisation actuelle des langues, qui complèterait ainsi celle que l'on obtenait grâce à la question portant sur la première langue apprise dans l’enfance (Lachapelle, 1991).

La question sur la langue parlée le plus souvent à la maison, ainsi ajoutée au questionnaire du recensement en 1971, procurait donc une information sur la langue d'usage principale dans la sphère familiale ou privée. Elle permettait également, en la croisant avec l'information sur la langue maternelle, d'étudier le phénomène des transferts (ou substitutions linguistiques), soit le fait d'adopter une autre langue que sa langue maternelle comme principale langue d'usage au foyer. De plus, en raison du fait que la langue parlée le plus souvent à la maison est généralement celle qui sera transmise aux enfants (Lachapelle, 1991; Marmen et Corbeil, 2004; Lachapelle et Lepage, 2010), son ajout au recensement permettait ainsi d’étudier et de mesurer les phénomènes de mobilité inter- et intragénérationnelle des langues.

Quant à la question sur la connaissance du français ou de l'anglais – question également posée depuis 1901 au recensement – elle permettait de mesurer le bilinguisme français-anglais et, en particulier au cours des premières décennies du 20e siècle, la connaissance de l'anglais, langue du commerce et des affaires, chez les Canadiens-français et les nouveaux immigrants de langue maternelle autre que française ou anglaise (Houle et Cambron-Prémont, 2015).

En raison de la forte poussée et de la diversification de l’immigration internationale à partir du milieu des années 1980, une immigration de plus en plus originaire de pays non européens et très majoritairement de langue maternelle tierce (autre que le français ou l’anglais)Note 14, la question se posait de savoir quelle approche adopter au regard de ces nouveaux citoyens pour établir la langue officielle dans laquelle ils sont susceptibles de demander des services et de communiquer avec le gouvernement fédéral. Nombre d’intervenants et d’acteurs gouvernementaux avaient ainsi commencé à s’interroger sur la « première langue officielle » de ces individus. Ces immigrants, au fur et à mesure que se prolonge leur durée de résidence au Canada, ont en effet tendance à utiliser le français ou l'anglais à la maison ou au travail, et moins de 2 % de la population canadienne déclare d’un recensement à l’autre ne connaître ni le français ni l'anglaisNote 15.

À la demande du gouvernement fédéral, du Conseil du Trésor en particulier, Statistique Canada a développé en 1989 différentes variantes de la notion de « première langue officielle parlée (PLOP) » pour estimer la population minoritaire francophone (Canada et chacune des provinces à l’extérieur du Québec) et anglophone (au Québec). À ce titre, Statistique Canada (1989) affirmait que « plusieurs valeurs peuvent être obtenues selon les hypothèses faites et selon l’ordre dans lequel les trois variables [connaissance des langues officielles, langue maternelle et langue parlée le plus souvent à la maison] présentes dans le recensement [de 1986] sont prises en compte ».

C’est en décembre 1991 que la méthode, dite méthode I, adoptée par le gouvernement fédéral a été inscrite dans le Règlement sur les langues officielles — Communications avec le public et prestation de services. À l'article 2 de ce Règlement on y décrit la méthode utilisée pour déterminer la PLOP,  la première des deux variantes présentées dans Estimations de la population selon la première langue officielle parlée (Statistique Canada, 1989), méthode qui « tient compte premièrement [et successivement], de la connaissance des langues officielles, deuxièmement, de la langue maternelle et, troisièmement, de la langue parlée le plus souvent à la maison »Note 16.

Comme mentionné dans cette publication, la notion de première langue officielle parlée comprend deux dimensions spécifiques. D'une part, l'épithète « parlée » signifie qu'une personne doit pouvoir soutenir une conversation dans la première langue assignée. D'autre part, le qualificatif « première » revêt deux significations différentes. Parmi la population dont le français ou l'anglais est la langue maternelle, iI désigne d'abord la langue apprise en premier lieu dans la petite enfance (langue maternelle). Chez les personnes n'ayant pas le français ou l'anglais comme langue maternelle, il désigne plutôt, au sens de principal, la langue la mieux connue au moment du recensement ou celle parlée le plus souvent à la maison.

L'application de la première langue officielle parlée (PLOP) au cas québécois revêt une valeur heuristique certaine lorsqu'il est question de mesurer la langue que la population de langue maternelle tierce est le plus susceptible d'utiliser dans la sphère publique, voire celle dans laquelle elle est le plus à l'aise pour communiquer. Ainsi, lors de l’Enquête sur la vitalité des minorités de langue officielle (EVMLO) menée par Statistique Canada en 2006 en collaboration avec une dizaine de ministères et d'agences du gouvernement fédéral, on y apprenait que chez les adultes de la région métropolitaine de recensement de Montréal, là où est concentrée la très forte majorité des Québécois ayant l'anglais comme première langue officielle parlée, 94 % de la population ayant l'anglais comme première langue officielle parlée a déclaré être plus à l'aise en anglais qu'en français pour communiquer, alors que chez les personnes ayant le français comme PLOP, 95 % a déclaré être plus à l'aise dans cette langue pour parler. Le fait de projeter la population à l'horizon de 2036 en fonction du critère de la première langue officielle parlée peut donc fournir une information utile et pertinente dans la mesure où, pour une part importante de la population de langue maternelle tierce, ce critère ne correspond pas à celui de la principale langue d'usage à la maison, mais bien à la langue officielle dans laquelle elle se sent le plus à l'aise.

1.4 Ce que permet le modèle de microsimulation Demosim

Demosim est un modèle de microsimulation créé et maintenu à Statistique Canada qui permet la réalisation de projections démographiques de plusieurs caractéristiques de la population canadienne comme, par exemple, le statut des générations, le groupe de minorités visibles, l’identité autochtone, la langue maternelle, etcNote 17.

Bien que ce modèle utilise la méthode des composantes comme dans les modèles de projections traditionnels (soit les modèles par cohortes et composantes), il s’en distingue du fait qu’au lieu de projeter des agrégats d’individus ou cohortes, il projette les individus un à la fois (microsimulation). La population de base de la version actuelle de Demosim a été constituée à partir des fichiers de microdonnées de l’Enquête nationale auprès des ménages (ENM) de 2011 ajustée pour le sous-dénombrement net au recensement et les réserves partiellement dénombrées à l’ENMNote 18.

Début de l'encadré 1

Encadré 1.
Population de départ : l’Enquête nationale auprès des ménages.

Les données pour la population de départ sont tirées de l’Enquête nationale auprès des ménages (ENM) de 2011, corrigée pour le sous-dénombrement net. Les trois variables linguistiques qui ont été projetées au moyen de Demosim (ainsi que la variable dérivée de la première langue officielle parlée) ont également été posées au recensement de 2011. Toutefois, le recensement de 2011, bien qu’envoyé à l’ensemble des ménages du Canada, ne comptait, outre les trois variables linguistiques, que quelques variables démographiques comme le sexe, la date de naissance (l’âge) ou la situation matrimoniale. Contrairement à l’ENM de 2011, le recensement de la même année ne posait aucune question sur le statut d’immigrant ou l’année l’immigration, la migration interne, le plus haut niveau de scolarité, etc. L’ENM de 2011 a donc été privilégiée comme population de départ en raison des détails qu’elle permet de connaître sur la composition de la population canadienne en début de projection.

Fin de l'encadré 1

Les modèles par cohorte ont été le plus souvent utilisés pour projeter une seule variable linguistique à la fois, soit la langue maternelle soit la langue parlée le plus souvent à la maison. Avec la version actuelle de Demosim, au contraire, on peut projeter trois variables linguistiques simultanément et générer une quatrième variable linguistique en cours de projection. La langue maternelle, la langue parlée le plus souvent à la maison, la connaissance des langues officielles et la première langue officielle parlée (PLOP) sont ainsi les quatre variables projetées par Demosim.

La microsimulation permet de projeter ces variables linguistiques supportées, grâce aux sources de données disponibles et aux méthodes d’estimation employées, par de nombreuses autres variables sociodémographiques. Les paramètres de projection des transitions relatives à chacune des trois variables linguistiques sont calculés, pour la plupart, au moyen de régressions logistiques (bi- et multinomiales) qui tiennent compte de l’effet de plusieurs variables sociodémographiques (scolarité, âge, statut des générations, etc.) qui sont projetées en même temps.

Dans notre étude, l’approche suivie pour projeter les variables linguistiques comprend les éléments suivants :

L’approche par microsimulation projette donc de manière simultanée et cohérente un très grand nombre de caractéristiques, dont quatre caractéristiques linguistiques, pour chaque individu. Cette approche capte les changements dans la composition démographique de la population qui se produisent en cours de projection et tient compte des comportements différentiels des individus en fonction de leurs caractéristiques.

Toute la mécanique d’estimation de la mobilité linguistique est rendue possible par l’accessibilité aux microdonnées de l’ENM de 2011 d’une part (voir encadré 2), et par la disponibilité à Statistique Canada de couplages d’enregistrements des recensements de 2001 et 2006 et de couplages d'enregistrements des recensements de 2006 et 2011 d’autre part. À cet égard, les données de l’ENM servent à attribuer les caractéristiques linguistiques aux nouveau-nés et les couplages permettent d'identifier les principaux flux des transitions linguistiques individuelles (par exemple, pour un individu donné, l'apprentissage d'une langue, la transition vers l'adoption d'une nouvelle langue principale à la maison, etc.). Le couplage 2001-2006 a servi à modéliser les transitions de la langue parlée le plus souvent à la maison tandis que le couplage 2006-2011 a servi à la modélisation des transitions de la connaissance des langues officielles (voir encadré 3).

Début de l'encadré 2

Encadré 2.
La comparabilité des données linguistiques de l’ENM de 2011.

Le document méthodologique sur les données linguistiques du recensement de 2011 (Houle, Corbeil et Nault, 2013) a mis en lumière le fait que ce recensement sous-estime, par rapport aux recensements de 2001 et 2006 (questionnaires détaillés), la part relative des langues tierces, tant pour ce qui est de la langue maternelle que pour la langue parlée le plus souvent à la maison. En 2011, les informations linguistiques de base ont été recueillies au moyen d’un questionnaire abrégé ne comportant que dix questions, plutôt que les 53 posées en 2006 avec le questionnaire détaillé, ce qui a eu cet effet inattendu sur les déclarations aux questions sur la langue maternelle et la langue parlée le plus souvent à la maison. Toutefois, la connaissance des langues officielles ne semble pas avoir été affectée par le changement de questionnaire ni la variable dérivée de la première langue officielle parlée (PLOP).

Comme les comptes linguistiques de l’ENM ont été pondérés pour refléter ceux du recensement de 2011, les données selon la langue maternelle et la langue parlée le plus souvent à la maison de l’ENM produisent également des effectifs non comparables par rapport aux recensements antérieurs. Si l’ENM, qui est utilisée comme population de départ pour Demosim, a été corrigée pour le sous-dénombrement net, elle ne l’a pas été pour rendre les variables linguistiques comparables avec celles des recensements antérieurs. Toutefois, nous nous sommes assurés que la projection des variables linguistiques est cohérente avec les évolutions passées sans égard au biais entraîné par le changement de questionnaire entre 2006 et 2011 (voir l'encadré 3).

Afin de contourner les problèmes de comparabilité, nous avons donc examiné les transitions observées entre 2001 et 2006. Cette approche a découlé du fait que nous nous sommes demandé si l’ENM de 2011 pouvait être utilisée sans risque pour l’estimation des paramètres de transmission des caractéristiques linguistiques des mères aux nouveau-nés. Ces paramètres ont été calculés respectivement avec le recensement de 2006 et l’ENM de 2011 et les résultats ont montré qu’il n’y avait aucune différence sensible entre les deux : les tests effectués à partir de l’une et l’autre série de paramètres n’ont pas montré de différence notable des effectifs projetés des différents groupes linguistiques.

Fin de l'encadré 2

Début de l'encadré 3

Encadré 3.
L’utilisation des couplages pour l’estimation des paramètres de la mobilité intragénérationnelle.

Les taux de transition de la langue parlée le plus souvent à la maison et de la connaissance des langues officielles ont été estimés au moyen de modèles de régression. Deux couplages distincts entre recensements ont été utilisés à ces fins : un couplage entre les recensements de 2001 et 2006, puis entre 2006 et 2011. Pour les transitions de la langue parlée le plus souvent à la maison, on a utilisé le couplage entre les recensements de 2001 et 2006 et non celui entre 2006 et 2011 en raison des lacunes entourant la comparabilité des résultats relatifs à cette variable entre 2006 et 2011.

Le couplage entre les recensements de 2006 et 2011 a cependant été utilisé pour l’estimation des paramètres de transition de la connaissance des langues officielles malgré la différence de questionnaire. Ce couplage comporte deux avantages notables par rapport au couplage entre les recensements de 2001 et 2006. D’une part, la méthode et la qualité du couplage sont supérieures : le taux de couplage qui en a résulté a été de 70 %. D’autre part, parce que le recensement de 2011 (questionnaire abrégé) incluait nos trois variables linguistiques d’intérêt, le questionnaire détaillé de 2006 et le questionnaire abrégé de 2011 ont donc pu être appariés, ce qui a permis d’augmenter considérablement la taille de la population couplée qui s’est ainsi chiffrée à 4,5 millions de personnes. Un essai effectué avec le couplage entre 2001 et 2006 nous a d’ailleurs confirmé la justesse de ce choix.

Fin de l'encadré 3

Les couplages permettent de distinguer plusieurs flux simples de mobilité linguistique (intra- et intergénérationnelle et apprentissage ou perte de connaissance d'une langue officielle) composés d’une combinaison de deux caractéristiques linguistiques d’origine observées à un recensement donné et d’une unique caractéristique linguistique de destination observée cinq ans plus tard au recensement suivantNote 21. Les couplages permettent d’isoler l’ensemble des flux bruts de mobilité et de désagréger la population en sous-groupes pouvant afficher des comportements propres en matière de pratiques linguistiques. Comme le signale si bien Termote, « plus la population est désagrégée en catégories homogènes, plus la prévision sera fiable » (Termote, 2011 : 71), ce qui parait tout à fait pertinent pour les sous-populations définies par leurs caractéristiques linguistiques.

Les paramètres de la mobilité intra-générationnelle ont été estimés au moyen de 20 modèles de régression pour la mobilité de la langue parlée le plus souvent à la maison qui représentent 90 % de l’ensemble des transitions individuelles, et de 28 modèles pour la mobilité (apprentissage ou perte) de la connaissance des langues officielles qui constituent 97 % de l’ensemble des transitions individuelles.

Ce qui est vrai des transitions linguistiques l’est aussi de l’attribution des caractéristiques linguistiques aux enfants à la naissance (la transmission). Les flux intergénérationnels mère-enfant ont été désagrégés de façon similaire à la désagrégation des flux de transition linguistique et pour les mêmes raisons. La modélisation de ces flux fait intervenir sensiblement les mêmes variables indépendantes que les modèles de transition, ce qui assure la cohérence entre les deux formes de mobilité. Au total, les paramètres de transmission de la langue parlée à la maison et de la langue maternelle ont été estimés au moyen de 10 modèles de régressions et ceux de la connaissance initiale des langues officielles par le biais de 12 modèles de régression.

En regard de la méthode par cohorte, la microsimulation augmente considérablement le potentiel analytique des projections, notamment le fait de pouvoir cibler l’évolution des caractéristiques linguistiques de certaines sous-populations (par ex. les immigrants de langue française vivant hors Québec) ou certains phénomènes (par ex. les transferts linguistiques). Les possibilités et la flexibilité dans l’élaboration d’hypothèses et de scénarios d’évolution future de la population s'en trouvent également facilitées et accrues.

1.5 Scénarios analysés dans la présente étude

Dans le cadre des présentes projections linguistiques, 16 scénarios sont analysés, soit 11 scénarios de base qui s’inspirent en grande partie de ceux présentés dans le rapport Immigration et diversité : projections de la population du Canada et de ses régions, 2011 à 2036 et cinq scénarios préparés spécifiquement pour cet exercice de projection linguistique et qui serviront à appuyer certains aspects précis de l’analyse.

Les hypothèses des 11 scénarios de base qui sont analysés dans notre étude sont présentées au tableau 1.1Note 22. Ces neuf scénarios se distinguent de ceux utilisés pour la projection de la diversité et de l'immigration par la période de référence retenue pour la mesure de la migration interne. Pour les projections de la diversité et de l'immigration, la composante de la migration interne est calculée sur la base des données des recensements de 2001 et 2006 et de l’Enquête auprès des ménages (ENM) de 2011. Dans les projections linguistiques, la migration interne a été calculée à partir du recensement de 2006 et de l’ENM seulement. La raison tient au fait que la mobilité interne de la période 1996-2001 a été exceptionnelle pour les populations de langue française du Québec. Durant cette période en effet, la conjoncture économique a incité un nombre important de Québécois de langue maternelle française à quitter la province pour aller s’établir principalement en Ontario, en Alberta et en Colombie-BritanniqueNote 23. Le caractère exceptionnel du patron de migration interne de la période 1996-2001 nous a toutefois conduits à en faire un scénario en soi (voir ci-après).

Le scénario de référence (scénario 1.1) et les scénarios de faible et forte immigration (1.3 et 1.4) sont abondamment utilisés dans ce rapport. Les scénarios de base comprennent également quatre autres scénarios qui se distinguent du scénario de référence par la seule composante de l’immigration, soit son niveau (le scénario 1.2 d’immigration nulle après 2016), la distribution géographique des immigrants (scénarios 1.5 et 1.6) et les pays d’origine des immigrants (scénario 1.7). Ces quatre derniers scénarios sont analysés au chapitre 3. L’immigration est l'un de ces phénomènes démographiques aux répercussions majeures sur l’évolution démographique des divers groupes linguistiques au pays (voir le chapitre 2) et sur lequel l'État exerce une influence, tant en ce qui a trait au volume d’immigrants accueillis chaque année qu'à la composition de cette immigration, entre autres selon le pays de naissance ou la connaissance des langues officielles. Le scénario d’immigration nulle après 2016 n’est que théorique et peu plausible, mais il permet d’illustrer l’effet « absolu » du phénomène de l’immigration internationale sur l’évolution du portrait linguistique au pays.

Deux scénarios supplémentaires font varier, en plus de la composante de l’immigration internationale, le niveau de fécondité et l’espérance de vie (scénarios 1.8 et 1.9) de façon à obtenir un scénario de faible croissance et un scénario de forte croissance. Ces deux scénarios sont également analysés au chapitre 3.

Les scénarios 1.10 et 1.11 illustrent les répercussions des changements de patron de migration interne. Le scénario 1.10 est basé sur la migration interne de la période 1996-2001 caractérisée par une accélération, par rapport aux périodes encadrantes, de la migration interprovinciale des personnes de langue française du Québec vers le reste du Canada. Ce scénario, favorable aux populations de langue française à l’extérieur du Québec bien que faisant figure d’exception lors des 25 années ayant précédé 2011, a une certaine valeur heuristique étant donné qu’il s’est produit il y a à peine une quinzaine d’années; il ne semble donc pas impossible qu’il se reproduise à l'avenir sous certaines conditions. Le scénario 1.11 incorpore l'ensemble des patrons de migration interne des périodes 1996-2001, 2001-2006 et 2006-2011.

Il est utile de rappeler que « le scénario de référence s’appelle ainsi non en raison de son meilleur caractère prospectif, mais plutôt parce qu’il constitue un scénario central à partir duquel sont construits les autres scénarios » (Statistique Canada, 2017a : 24). Le scénario de référence combine, entre autres, un niveau d’immigration moyen de 8,3 immigrants pour 1 000 habitantsNote 24, une distribution provinciale ou territoriale des nouveaux immigrants à l’arrivée représentative de celle observée entre juillet 2010 et juin 2015, une émigration moyenne, une fécondité moyenne de 1,67 enfant par femme, une croissance moyenne de l’espérance de vie, un modèle de migration interne représentatif de la moyenne observée au cours des périodes 2001-2006 et 2006-2011, des transitions de la langue parlée le plus souvent à la maison observées durant la période 2001-2006 et finalement des transitions de la connaissance des langues officielles observées pendant la période 2006-2011. De plus, notons que la transmission ou l’attribution des caractéristiques linguistiques aux nouveau-nés, soit la langue maternelle, la langue parlée le plus souvent à la maison et la connaissance des langues officielles, est basée sur l’ENM de 2011.

Cinq autres scénarios, reposant sur les hypothèses relatives au scénario de référence, ont été élaborés spécifiquement pour les projections linguistiques. Ces scénarios sont analysés aux chapitres 3 et 5.

Ces scénarios ne se distinguent du scénario de référence que par une seule composante, soit les taux de transition de la connaissance des langues officielles (scénarios 2.1, 2.2 et 2.3), la composition linguistique de l’immigration (scénario 2.4) et les taux de transmission intergénérationnelle du français à l’extérieur du Québec (scénario 2.5). Le tableau 1.2 présente une description sommaire de chacun de ces cinq scénarios.

Les scénarios relatifs au bilinguisme français-anglais (scénarios 2.1 à 2.3) visent à tester l’effet que pourraient avoir certains changements dans les taux d'acquisition et de rétention (lesquels pourraient découler, par exemple, d'un accroissement de la fréquentation de programmes de langue seconde et de mesures favorisant une plus forte rétention des acquis) sur l’évolution du bilinguisme français-anglais au Canada d’ici 2036. On a ainsi d'abord examiné, avec le scénario 2.1, l'hypothèse suivant laquelle l’apprentissage de l’autre langue officielle pourrait être doublé parmi l’ensemble de la population des jeunes âgés de 5 à 14 ans au Canada hors Québec. On sait que le bilinguisme est en progression durant cette période de la vie, et le fait de doubler les probabilités de devenir bilingue ou, à tout le moins, ne serait-ce que de les accroître, n’est pas en soi totalement irréaliste.

Nous nous sommes ensuite demandé, avec le scénario 2.2, dans quelle mesure le maintien des acquis du bilinguisme chez les personnes de langue anglaise après l’âge de 18 ans pourrait contribuer à rehausser le niveau de bilinguisme de la population canadienne dans son ensemble. Lepage et Corbeil (2013) ont montré que le bilinguisme atteint un sommet au cours des années de fréquentation scolaire chez les jeunes de langue anglaise à l’extérieur du Québec, mais qu’il y a par la suite une érosion de cette compétence au sein de cette population au fur et à mesure qu’elle progresse en âge. On pourrait sans doute penser que certaines mesures ou certains mécanismes peuvent favoriser une plus forte rétention des acquis en matière de bilinguisme français-anglais chez les jeunes adultes de langue anglaise au Canada hors Québec. Le chapitre 5 traite notamment de l'évolution importante de la fréquentation de programmes d'immersion en français au Canada hors Québec, laquelle tend à se traduire par une plus forte rétention des acquis en français que la fréquentation de programmes réguliers de langue seconde.

Le scénario 2.3 combine les hypothèses développées spécifiquement pour les scénarios 2.1 et 2.2 décrites plus haut. Il constitue donc un scénario généralement favorable à l’accroissement du bilinguisme au pays.

Le scénario 2.4 est une simulation visant à estimer le nombre d’immigrants de langue française (selon le critère de la première langue officielle parlée) requis chaque année entre 2017 et 2036 pour faire en sorte de maintenir constant au niveau de 2016 le poids démographique que représentent les populations minoritaires de langue française dans chaque province. Nous avons calculé le nombre nécessaire d’immigrants pour que le poids de la population de langue française, non-immigrants et immigrants confondus, cesse de diminuer à partir d’un point de référence dans le temps. L’immigration de la période 2011-2016 s’étant déjà réalisée et étant intégrée dans Demosim, nous avons amorcé la simulation à partir de 2017.

Le scénario 2.5, bien que théorique, se rapporte à des changements de comportement parmi les populations de langue française du Canada hors Québec. On sait que les transferts linguistiques vers l’anglais sont importants au sein de ces populations et que la transmission du français aux enfants est incomplète (voir le chapitre 2). En faisant l'hypothèse que la population de langue française au Canada hors Québec affiche un taux de transmission quasi complet du français, quel effet cela aurait-il sur l’effectif et le poids démographique de leurs communautés? Un niveau quasi complet de transmission équivaut au taux de transmission observé parmi les couples endogames, soit plus de 90 %Note 25. Bien que ce scénario ait un caractère purement théorique, car de tels comportements ne se modifient que très lentement, il permet néanmoins d'estimer l'importance du phénomène de la mobilité linguistique intergénérationnelle sur l'évolution de la population de langue française au Canada hors Québec d'ici 2036.


Date de modification :