Publications
Projections démographiques pour le Canada (2013 à 2063), les provinces et les territoires (2013 à 2038) : rapport technique sur la méthodologie et les hypothèses
- 91-620-X
- Page principale
- Introduction
- Chapitre 1 : Le modèle de projection par cohorte et composante de Statistique Canada
- Chapitre 2 : Enquête d’opinion sur les tendances démographiques futures
- Chapitre 3 : Projection de la fécondité
- Chapitre 4 : Projection de la mortalité
- Chapitre 5 : Projection de l’immigration internationale
- Chapitre 6 : Projection de l’émigration
- Chapitre 7 : Projection des résidents non permanents
- Chapitre 8 : Projection de la migration interne
- Remerciements
- Renseignements supplémentaires
- Version PDF
Chapitre 1 : Le modèle de projection par cohortes et composantes de Statistique Canada
Consulter la version la plus récente.
Information archivée dans le Web
L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.
Par Patrice Dion
- Introduction
- Le modèle par cohortes et composantes
- Liens entre le PED et les projections
- Algorithme du modèle
- Conclusion
- Références
- Notes
Introduction
Ce chapitre vise à présenter le modèle de projection par cohortes et composantes de Statistique Canada dans son ensemble. La première section illustre les fondements généraux du modèle en rappelant brièvement ses origines. Suit une description du modèle utilisé par Statistique Canada et de ses spécificités, montrant notamment comment les programmes des estimations et des projections démographiques sont articulés, et comment le second peut être vu comme une extension du premier. Enfin, la dernière section expose plus en détail l’algorithme employé afin de transformer les paramètres en projections.
Le modèle par cohortes et composantes
Genèse du modèle
L’idée d’établir des projections de la population s’est popularisée au 18e siècle, dans un contexte où l’Europe connaissait certaines crises sociales et épidémiologiques importantes. Les premières projections de population consistaient en des extrapolations de la population totale. À cette époque, on s’intéressait surtout à découvrir une loi universelle qui gouvernait la croissance des populations, un « multiplicateur universel » qui aurait répondu à certaines lois de la nature. Par exemple, à la fin du 18e siècle, Malthus suggéra que la population croît de façon exponentielle, ce qui crée un déséquilibre avec les ressources disponibles qui, elles, croissent de façon linéaire.
Ainsi, jusqu’au début du 20e siècle, s’il était reconnu que la mortalité et la fécondité avaient un impact sur la croissance des populations, ces phénomènes n’étaient pas intégrés dans les calculs de projection de population. Ce n’est que plus tard, et graduellement, que fut développée la méthode par cohortes et par composantes, les premières projections par composantes apparaissant au début du 20e siècle. Il s’agissait d’un pas important en démographie, ayant permis de mieux comprendre la dynamique des populations et d’intégrer plusieurs champs de connaissances pour former la démographie classique telle qu’on la connaît aujourd’hui (Le Bras 2008).
Les premières projections par composantes incluaient des taux de mortalité variant selon l’âge mais le nombre de naissances était donné a priori, sans égard à la population. Un développement important est apparu en 1924 avec la publication d’Elements of Physical Biology d’Alfred Lotka. En associant à la table de mortalité des probabilités pour les femmes de donner naissance, Lotka introduisait l’idée que les femmes peuvent avoir des taux de fécondité qui sont fonction de leur âge. Il montrait ainsi la possibilité de proposer des projections à l’aide de taux de mortalité et de fécondité variables pouvant être appliqués à des cohortesNote 1.
La façon dont la migration était traitée dans les premiers modèles de projections par cohortes et composantes demeurait toutefois problématique. En effet, ces modèles adoptaient le plus souvent une perspective unirégionale, dans laquelle chaque région était projetée indépendamment des autres. Lorsque considérée, la migration était alors traitée à l’aide de soldes prédéterminés ou de taux de migration nette. Ainsi, les avantages de l’utilisation de taux de fécondité et de mortalité par âge appliqués directement aux populations à risque étaient absents en ce qui concerne la migration. Il faut attendre l’apparition d’un nouveau paradigme en démographie, nommé démographie multirégionale, et dont le développement a débuté au milieu des années 1960, pour voir apparaître des modèles de projection considérant les régions comme un système composé de plusieurs populations interdépendantes et liées entre elles par des flux migratoires (Rogers 2006). Ainsi, à l’aide d’opérations matricielles, les modèles de projection multirégionaux permettent d’intégrer les taux de migration spécifiques de chacune des régions du système vers chacune des autres régionsNote 2, Note 3.
Les modèles de projection par cohortes et composantes représentent un progrès considérable par rapport aux modèles d’extrapolation de la population totale parce qu’ils associent les mesures quantitatives de la mortalité et de la fécondité à la croissance de la population et à sa composition et parce qu’ils permettent l’élaboration d’hypothèses spécifiques pour chaque composante en tirant parti de ce qui est connu pour chacune d’elles (O’Neill et coll. 2001). Il ne s’agit alors plus de tenter de prédire la croissance de la population, mais plutôt de prévoir les changements en termes de fécondité et de mortalité.
Le modèle par cohortes et composantes de Statistique Canada
Aujourd’hui, la plupart des agences statistiques établissent leurs projections officielles à l’aide du modèle par cohortes et composantes. À Statistique Canada, le modèle a été utilisé afin de produire des projections « officielles » pour la première fois dans les années 1970, alors que les projections démographiques devenaient une activité importante à Statistique CanadaNote 4. Depuis la première série diffusée en 1974, sept autres ont suivi, généralement selon le cycle des recensements de la populationNote 5. Le modèle a évolué avec les années; ainsi, la version purement multirégionale du modèle n’est apparue qu’avec l’édition 1984-2006.
Le modèle par cohortes et composantes de Statistique Canada a été développé de façon à prolonger dans le temps les séries de données du Programme des estimations démographiques (PED) de Statistique Canada. Ainsi, les modèles provinciaux d’estimation et de projection sont des modèles de comptabilité constitués des mêmes composantes :
Dans le contexte des projections, chaque scénario propose des hypothèses sur l’évolution future de chacune de ces composantesNote 6, et distinctement pour chaque province et territoire. En fait, Statistique Canada utilise une approche « ascendante hybride » : « ascendante » parce que les valeurs projetées pour le Canada sont la somme des projections individuelles des provinces et des territoires, le Canada n’étant pas lui-même projeté, et « hybride » car les hypothèses sont souvent élaborées au niveau national dans un premier temps. En d’autres mots, les hypothèses pour chaque province et territoire sont dérivées d’hypothèses élaborées d’abord au niveau national.
Liens entre le PED et les projections
Tel que précisé plus haut, les données du PED constituent l’univers de référence et la source principale des projections démographiques dans le contexte du modèle par cohortes et composantes. Une description sommaire des différentes séries produites par le PED s’impose ici afin de bien comprendre la nature des liens unissant estimations et projections démographiques de Statistique Canada.
Les données sources des projections
Dans le but de répondre à des besoins d’actualité et d’exactitude des données, le PED produit plus d’une série d’estimations démographiques pour une même date de référence, mais toutefois à des moments différents. Les estimations postcensitaires sont produites à partir du plus récent recensement rajusté pour le sous-dénombrement net du recensement (SDNR) incluant le rajustement pour les réserves indiennes partiellement dénombrées. Trois séries d’estimations postcensitaires existent. Les estimations postcensitaires provisoires sont disponibles peu de temps après la date de référence, mais doivent pour cela intégrer une sélection d’hypothèses vu l’absence de données pour certaines composantes. Les estimations postcensitaires mises à jour et les estimations postcensitaires définitives sont créées respectivement un an et deux ans après les estimations postcensitaires provisoires. À défaut d’être très ponctuelles, ces séries intègrent des données qui n’étaient pas disponibles au moment de l’élaboration des estimations provisoires, et gagnent ainsi habituellement en exactitude. De façon générale, toutefois, l’exactitude des données postcensitaires tend à diminuer à mesure que l'on s'éloigne de la date du dernier recensement.
Les données de chaque nouveau recensement ainsi que les résultats des études de couverture menées suite au recensement permettent d’estimer l’exactitude des estimations postcensitaires. La différence entre les estimations postcensitaires au jour du recensement et les comptes du recensement (rajustés pour le SDNR (incluant les réserves indiennes partiellement dénombrées)) est ainsi nommée erreur en fin de période. Elle provient des erreurs relatives aux composantes de l'accroissement démographique au cours de la période séparant deux recensements et des erreurs de précision dans la mesure de la couverture du recensement principalement dues à l’échantillonnage. Au moment de l’établissement d’une nouvelle base de population suite à un recensement, une dernière série d’estimations est élaborée, les estimations intercensitaires, qui consistent en des estimations postcensitaires définitives révisées de façon à tenir compte de l’erreur en fin de périodeNote 7. Pour ce faire, une composante supplémentaire appelée écart résiduel, qui intègre l’erreur en fin de période, est ajoutée, les autres composantes de l’accroissement démographiques demeurant inchangées par rapport aux estimations postcensitaires définitives.
Ainsi, chaque série d’estimations présente un certain compromis entre l’actualité des données et l’exactitude. Les projections démographiques de la présente édition ont pour point de départ la population canadienne au 1er juillet 2013 provenant des estimations postcensitaires provisoires. Il est jugé préférable d’utiliser les données les plus actuelles possibles plutôt que des données plus « exactes » mais moins à jour, cela afin de tenir compte des tendances démographiques les plus récentes.
Cela étant, d’autres considérations s’appliquent pour le calcul des paramètres de projection lorsque ceux-ci ont pour fondement les données des estimations démographiques. D’abord, il y a naturellement lieu dans ce contexte de privilégier les estimations considérées les plus exactes. Ensuite, les estimations postcensitaires n’ont de cohérence historique que sur une période quinquennale, puisqu’elles repartent sur une nouvelle base à la suite de chaque recensement. Ces deux raisons font en sorte que les estimations intercensitaires constituent l’ultime série de référence des projections pour l’élaboration des hypothèses portant sur les composantes de la croissance. En fait, lorsque des estimations postcensitaires sont utilisées, c’est seulement parce que les séries intercensitaires ne sont pas encore disponibles.
Cela comporte toutefois une difficulté : dans les estimations intercensitaires, l’équation démographique ne balance qu’à condition d’inclure la composante résiduelle; or, la nature même de cette composante et ses tendances historiques font en sorte qu’il est à la fois non désirable et très difficile de la projeter. Bien que l’erreur en fin de période n’ait qu’un impact mineur au niveau national sur les projections, la différence peut être moins négligeable à l’échelle des provinces et territoiresNote 8. En outre, une série de projections ne bénéficie pas de révisions à la manière des données du PED. C’est pourquoi la présente édition introduit des stratégies pour tenir compte de la composante résiduelle dans les projections. Ces stratégies visent à analyser les sources de l’écart résiduel de façon à le répartir, lorsque possible, dans les autres composantes démographiques. Le but est de minimiser l’importance de l’écart résiduel, mais aussi d’accroître l’exactitude des autres composantes démographiques. Deux initiatives distinctes sont utilisées, visant autant de composantes, soit celles de l’immigration et de l’émigration. Elles sont décrites en détail dans les chapitres correspondants dans ce rapport.
Les hypothèses de projection
Les liens unissant les projections des données du PED influencent non seulement la structure du modèle par cohortes et composantes, mais également la façon dont les hypothèses de projection sont conçues. Les hypothèses proposent toujours, d’une façon ou d’une autre, une fonction qui demeure constante. Pour prendre l’exemple de la composante de mortalité, une hypothèse pourrait proposer qu’à court terme le nombre de décès demeurera constant dans le futur. Toutefois, une hypothèse voulant que les risques en matière de mortalité demeurent constants proposera plus vraisemblablement des taux ou des quotients de mortalité constants. Et comme c’est le devenir de cohortes par âge et sexe qui est projeté, ces taux ou ces probabilités de mortalité devraient être désagrégés par âge et sexe, ce qui permet de tenir compte non seulement de la taille, mais aussi de la structure des populations à risque. Sauf de rares exceptions, les hypothèses sont élaborées sous forme de taux plutôt que de probabilités ou de quotients, car leur calcul se prête mieux aux données des estimations démographiques et de l’état civilNote 9. C’est que la mesure des évènements démographiques (lire les composantes) n’est pas associée à une population à risque, nécessaire au calcul de probabilités. Pour reprendre l’exemple de la mortalité, les décès comptabilisés au cours d’une année peuvent être survenus à des personnes étant au Canada au début de l’année, mais aussi à des immigrants arrivés en cours d’année. Ainsi, les différentes composantes de l’accroissement démographique exercent simultanément un impact sur la population à risque si bien qu’il est impossible de retracer un nombre exact de personnes à risque. Il est possible toutefois de trouver un dénominateur adéquat en estimant le nombre moyen de personnes-années, qui amalgame le nombre de personnes (à un endroit) et la durée de leur présence au cours d’une annéeNote 10. Par exemple, une personne qui aura été présente six mois au Canada contribuera théoriquement pour 0,5 personnes-années au dénominateur. Le nombre de personnes-années est estimé le plus souvent en calculant la moyenne de la population en début de période et celle en fin de période (un an plus tard).
Algorithme du modèle
En plus des raisons mentionnées plus haut, l’utilisation de taux présente un autre avantage : les taux des différents évènements démographiques peuvent être additionnés (contrairement à des probabilités) de façon à tenir compte de l’interaction entre les évènements, au lieu d’appliquer chaque évènement dans un ordre prédéfini. Le modèle de projection additionne tous les taux et les regroupe pour former des taux de sortie dans une matrice dite de transition. La matrice de transition comporte une rangée et une colonne pour chaque combinaison d’âge, sexe et province/territoire. Plus spécifiquement, les taux de sortie (nets) sont localisés en diagonale :
Une cellule donnée située dans la diagonale de la matrice de transition s’applique à une région spécifique est donc constituée de l’ensemble des taux s’appliquant à cette région : taux de mortalité , taux d’immigration , taux d’émigration total , taux d’émigration de retour , et taux de sortie global de la région vers les autres régions . Les indices r, a, et s réfèrent respectivement à la région, à l’âge et au sexe. Notez qu’à ce stade, les résidents non permanents (RNP) sont exclus du calculNote 11. Les cellules hors diagonale ne servent quant à elles strictement qu’à la migration interne. Exprimé en valeur négative, il s’agit des taux de migration interrégionale, de chaque région vers chaque autre région :
Les matrices de taux de transition sont ensuite transformées en matrice de probabilités de survie à l’aide d’opérations matricielles :
où représente la probabilité de survie et la matrice identité. La population projetée pour une année t+1 est obtenue en multipliant la population de l’année précédente t, sans les RNP, par les probabilités de la matrice :
où est le vecteur de la population en début de période, est le vecteur de la population en fin de période et est le vecteur de la population des résidents non permanents présents au début de la période.
Le modèle n’exclut toutefois pas l’utilisation de paramètres sous formes de quotients ou d’effectifs. Dans le cas de quotients, pour une composante donnée, ceux-ci sont d’abord transformés en effectifs :
où est un vecteur de quotients perspectifs.
Qu’ils proviennent de quotients ou non, les effectifs sont additionnés et le solde multiplié par la probabilité de survie sur la moitié de la période entre t et t+1, avant d’être ajouté à la population au temps t, laquelle est obtenue tel que montrée plus haut à l’aide des composantes dont les paramètres consistent en des taux :
où est le solde des composantes formulées en termes d’effectifs et , la probabilité de survie sur la moitié de la période, se calcule comme suit :
Enfin, les résidents non permanents au temps t+1 sont ajoutés à la fin :
Il ne reste qu’à ajouter les naissances provenant de la population des résidents permanents (RP) et de celle des résidents non permanentsNote 12. S’il s’agit d’effectifs, les naissances sont simplement ajoutées.
S’il s’agit de taux de fécondité, ces taux sont multipliés par la population moyenne estimée entre t et t+1. Dans le cas des résidents permanents, pour une région donnée, les naissances totales se calculent ainsi :
où représente les naissances totales provenant de la population des résidents permanents, les taux de fécondité par âge des RP et la population moyenne des RP au début de la période, estimée de la façon suivante :
Les naissances des RNP sont estimées de façon similaire à celles des RP :
où est calculé ainsi :
Enfin, le nombre de naissances de chaque sexe est obtenu à l’aide du rapport de masculinité spécifié à l’avance dans la projectionNote 13. Par exemple, pour la population des RP et dans une région donnée, les naissances de garçons et de filles seront calculées respectivement ainsi :
Conclusion
Le modèle de projections par cohortes et composantes possède de nombreux avantages. Sa relative simplicité contribue à en faire un modèle transparent, et facilite l’implication d’experts dans les processus de consultation, la communication des hypothèses aux utilisateurs et la reproductibilité des résultats. Le modèle n’en est pas moins grandement efficace quant à sa capacité de produire des projections plausibles. À ce chapitre, les innovations incluses dans la présente édition des projections renforcent la qualité, la transparence et la pertinence du Programme de projections nationales de Statistique Canada.
Le modèle de projection par cohortes et composantes sert également à produire des projections personnalisées pour des régions spécifiques et/ou selon des hypothèses particulières. Les améliorations apportées au programme au cours des dernières années permettent de renforcer la capacité de Statistique Canada à répondre rapidement aux demandes.
Références
George, M.V. 2001. « Population forecasting in Canada: Conceptual and methodological developments », Canadian Studies in Population, volume 28, numéro 1, pages 111 à 154.
Le Bras, H. 2008. The Nature of Demography, Princeton University Press, New Jersey, 362 pages.
Lotka A.J. 1924. Elements of Physical Biology, Williams & Wilkins, Baltimore, Maryland.
O’Neill, B., D. Balk, M. Brickman et M. Ezra. 2001. « A guide to global population projections », Demographic Research, volume 4, pages 203 à 288.
Rogers, A. 2006. « Demographic modeling of the geography of migration and population: A multiregional perspective », document de travail, présenté à la session spéciale « The Legends of Quantitative Geography » à l’International Geographical Union (IGU), conférence régionale, Brisbane, Australie, 3 au 7 juillet 2006.
Statistique Canada. 2010. Projections de la diversité de la population canadienne, 2006 à 2031, no 91-551 au catalogue de Statistique Canada.
Statistique Canada. 2012a. Méthodes d'estimation de la population et des familles à Statistique Canada, no 91-528 au catalogue de Statistique Canada.
Statistique Canada. 2012b. Projections de la population selon l’identité autochtone au Canada, 2006 à 2031, no 91-552 au catalogue de Statistique Canada.
Notes
Signaler un problème sur cette page
Quelque chose ne fonctionne pas? L'information n'est plus à jour? Vous ne trouvez pas ce que vous cherchez?
S'il vous plaît contactez-nous et nous informer comment nous pouvons vous aider.
- Date de modification :