Études analytiques : méthodes et références
Indices expérimentaux de l’activité économique des provinces et territoires au Canada : mesures expérimentales fondées sur des combinaisons de séries chronologiques mensuelles
par Nada Habli, Ryan Macdonald et Jesse Tweedle
Division de l’analyse économique, Statistique Canada No 027
Passer au texte
Début du texte
Remerciements
Les auteurs tiennent à remercier Étienne Saint-Pierre, Yvan Clermont, Danny Leung et Brenda Bugge pour leur soutien et leurs conseils tout au long du projet. Ils aimeraient aussi remercier Steve Matthews, Fred Picard et Michel Ferland pour leurs commentaires et leurs contributions sur la modélisation. Ils souhaitent également remercier Philip Smith et Karen Wilson pour leurs conseils, leurs suggestions et leur soutien.
Résumé
Le présent document porte sur les méthodes de création d’un indicateur mensuel de l’activité économique pour les provinces et les territoires. Il commence par la création d’un ensemble de données pour les provinces et les territoires, composé de séries mensuelles sur : la population active, y compris les salaires et l’emploi; le commerce international; les mesures de production telles que les ventes du secteur de la fabrication ou la production d’électricité; et les prix (consommation, logement et électricité). Lorsque cela est nécessaire, les séries sont désaisonnalisées, couplées et déflatées pour créer des séries chronologiques continues allant de janvier 2002 à avril 2020. Des méthodes de réduction des variables sont ensuite appliquées à l’ensemble de données provincial et territorial mensuel pour créer les indices expérimentaux mensuels de l’activité économique des provinces et territoires. Trois méthodes sont examinées : l’analyse en composantes principales (ACP), la moindre contraction absolue et opérateur de sélection (LASSO) et un indice simple composé de trois séries prédéterminées (emploi total, exportations totales et ventes au détail). Une moyenne pondérée de l’indice simple et de l’indice ACP est également calculée. En général, les indices produits donnent une assez bonne image de l’activité économique provinciale, suivant les mouvements cycliques des économies provinciales et territoriales. Toutefois, la configuration pour les modèles n’est pas idéale, car des données annuelles sont utilisées pour produire les paramètres des modèles, ce qui crée de l’incertitude quant au rendement du modèle. Par conséquent, plusieurs indices sont fournis. Une évaluation de la qualité donne une indication des forces et des limites des indices en ce qui concerne les différentes utilisations.
1 Introduction
Des mesures actuelles de l’activité économique sont essentielles pour comprendre le rendement des économies, et pour orienter les réponses stratégiques aux fluctuations macroéconomiques. Le début de la pandémie attribuable à l’émergence du virus SRAS-CoV-2 a mis l’accent sur ce point, ainsi que sur la nécessité de mesures spécifiques à la région géographique. À l’heure actuelle, le Canada dispose d’un solide système de production de mesures d’activité à jour, comme le produit intérieur brut (PIB) réel, au niveau national. En ce qui concerne les économies provinciales et territoriales, des renseignements mensuels sur les marchés du travail ou sur des activités particulières comme la fabrication ou le commerce international sont disponibles, mais on ne dispose pas d’une mesure mensuelle de l’activité économique agrégée.
Dans des circonstances normales, la production d’un nouvel ensemble d’indicateurs économiques agrégés pour les provinces et les territoires exigerait la création de mesures exploratoires, et demanderait peut-être le lancement de nouvelles enquêtes ou l’expansion des activités de collecte de statistiques existantes, ainsi que la création de l’infrastructure nécessaire à la production et à la diffusion des indicateurs de manière continue. La mise en œuvre de ces modifications nécessite du temps. Dans le contexte actuel, où la pandémie du SRAS-CoV-2 accentue les besoins en indicateurs économiques régionaux mensuels, le temps nécessaire pour mettre sur pied un nouveau programme statistique afin de répondre aux exigences actuelles signifie que cette approche est irréalisable.
Une approche plus rapide consiste à adopter une stratégie fondée sur des modèles statistiques afin de créer rapidement des mesures exploratoires pour l’activité économique provinciale. Bien que cette approche introduise une nouvelle mesure de l’activité économique en temps opportun, le compromis est que les méthodes employées ne sont pas utilisées dans les situations pour lesquelles elles sont idéales, que les entrées pour les modèles utilisent des séries actuellement disponibles sans pouvoir adapter leurs utilisations à la création d’un indicateur, et que les modèles reposent peu sur la théorie. Autrement dit, les modèles recherchent des corrélations dans les données plutôt que d’utiliser la théorie économique pour guider leur construction. Enfin, les modèles employés ici ont généralement un ensemble différent d’intrants pour chaque province ou territoire. Par conséquent, l’uniformité des structures du modèle ne peut être maintenue pour chaque province et territoire, ce qui peut avoir une incidence sur les comparaisons entre les secteurs de compétenceNote .
Pour estimer les indices de l’activité, une stratégie à deux volets est appliquée. En premier lieu, un ensemble de données de panel équilibré composé de séries chronologiques provinciales et territoriales mensuelles est constitué à partir de tableaux de l’Entrepôt commun de données de sortie (ECDS) qui sont accessibles au public. Cet ensemble de données s’étend de janvier 2002 aux plus récents points de données disponibles (actuellement avril 2020). Deuxièmement, trois méthodes sont appliquées à l’ensemble de données pour transformer la série mensuelle en un indicateur de l’activité économique provinciale et territoriale : un modèle simple, l’analyse en composantes principales (ACP) et la moindre contraction absolue et opérateur de sélection (LASSO). Un quatrième indice qui combine l’indice du modèle simple et l’indice basé sur l’ACP est également produit. Les résultats de ces approches forment les mesures exploratoires de l’activité économique provinciale agrégée qui sont présentées ici.
Les indices expérimentaux sont basés sur l’utilisation de modèles statistiques avec un ensemble de données d’entrée qui contient une série d’approximations et d’hypothèses. Parmi les hypothèses pour l’ensemble de données d’entrée, on compte notamment : l’utilisation de déflateurs nationaux pour produire de vraies séries provinciales lorsque les déflateurs provinciaux n’existent pas, l’hypothèse que les taux de croissance pour toutes les séries sont stationnaires en matière de covariance, et l’hypothèse que la winsorisation des données aux 5e et 95e percentiles est appropriée.
Pour les modèles, la croissance annuelle du PIB réel dans l’ensemble des provinces et des territoires sert de mesure de l’activité provinciale agrégée par rapport à laquelle les mesures dérivées de l’indice de l’activité économique sont comparées. Il en résulte une situation où un petit nombre d’observations annuelles sont utilisées pour estimer les paramètres du modèle qui sont utilisés pour déduire les fluctuations mensuelles. Le petit nombre d’observations a une incidence sur la capacité des modèles à fournir des inférences suffisantes, et l’utilisation de données annuelles peut masquer d’importantes différences dans le calendrier mensuel des variations des prix, de la production et de l’emploi.
Afin de permettre la possibilité que l’utilisation des données annuelles puisse avoir une incidence sur le rendement et l’inférence du modèle, le modèle simple suppose qu’un ensemble de variables est approprié et utilise les moindres carrés ordinaires (MCO) pour déterminer leur contribution relative. Dans le cas de l’ACP, on utilise un R carré ajusté et maximisé à partir des régressions par MCO pour choisir lesquels des 10 premiers composants principaux doivent être inclus. Dans ces deux situations, les régressions par MCO incluent des variables qui sont statistiquement non significatives. Pour le LASSO, la signification statistique des variables d’entrée potentielles détermine le modèle final. Toutefois, en ce qui concerne le LASSO, pour certaines économies, aucune variable d’entrée n’est sélectionnée. Dans ces cas, on utilise plutôt la méthode elastic-net ou une stratégie de modélisation générale à spécifique.
Comme l’ensemble de données d’entrée contient un certain nombre d’hypothèses et d’approximations et que les modèles statistiques sont utilisés dans un contexte imparfait, les indices expérimentaux qui sont créés doivent être considérés comme des approximations de l’activité économique agrégée plutôt que comme des mesures exactes. Les indices d’activité ont tendance à présenter une volatilité mensuelle considérable, et lorsqu’on les compare aux estimations du PIB réel produites par le gouvernement du Québec ou le gouvernement de l’Ontario, ils peuvent montrer une plus grande volatilité cyclique.
Dans l’ensemble des mesures, les modèles simples et les modèles LASSO tendent à s’appuyer davantage sur les séries d’emplois comme données d’entrée. L’indice simple a l’avantage d’être facile à comprendre et est le plus comparable pour toutes les provinces et tous les territoires puisqu’il maintient la constante des variables utilisées dans l’indice d’activité, peu importe la province ou le territoire. Les indices de l’ACP semblent saisir davantage de fluctuations liées à d’autres aspects de l’activité globale (p. ex. ventes ou exportations), mais ils présentent aussi une plus grande variabilité. La combinaison pondérée des indices simples définis par les chercheurs et des indices ACP a une meilleure corrélation avec la croissance du PIB réel que les indices constitutifs.
À l’heure actuelle, les indices pondérés ou les indices basés sur le LASSO semblent offrir le meilleur compromis entre les signaux présents dans les données et la variabilité des séries mensuelles. Cette évaluation est fondée sur la mesure dans laquelle les modèles semblent se conformer à la configuration utilisée pour l’estimation ainsi qu’au comportement des indices. Dans certains cas, comme l’indice fondé sur l’ACP pour Terre-Neuve-et-Labrador, il y a une anomalie qui remet en question la véracité de l’indice. Lorsque ce genre de situation se produit, les données sont considérées comme impropres à l’utilisation à l’heure actuelle, et les estimations pour cet indice ne sont pas fournies. Les évaluations sont en cours et peuvent entraîner des changements dans les utilisations ou les indices recommandés, à mesure que l’on étudie la possibilité d’élaborer davantage l’ensemble de données d’entrée, d’affiner les modèles ou d’autres stratégies de modèles.
Le reste du présent document est structuré comme suit. La section 2 traite de la création de l’ensemble de données d’entrée ainsi que des hypothèses utilisées pour filtrer et transformer les données avant la modélisation. La section 3 décrit les modèles employés, les hypothèses intégrées aux modèles, ainsi que leurs forces, leurs limites et leur application pour créer des indices mensuels. La section 4 présente une analyse du rendement du modèle et illustre les indices qui en résultent. La section 5 présente la conclusion.
2 Ensemble de données d’entrée
L’ensemble de données d’entrée est composé de mesures propres à une province ou à un territoire pour l’activité économique et les déflateurs économiques au niveau du Canada, sauf dans les cas où des déflateurs propres à une province ou à un territoire sont disponibles. Les séries mensuelles de données d’entrée sont composées d’enquêtes mensuelles sur la main-d’œuvre, les produits et les prix (tableau 1). Dans certains cas, les tableaux actifs ne contiennent pas de renseignements continus allant de janvier 2002 à ce jour. Dans ce cas, les tableaux historiques sont utilisés pour rétropoler les tableaux actifs.
Numéro de tableau | Titre du tableau |
---|---|
12100099 | Importations et exportations de marchandises, base douanière, selon le Système harmonisé de désignation et de codification des marchandises (SH), Canada, provinces et territoires, États-Unis, États |
12100119 | Commerce international de marchandises par province, produit et principaux partenaires commerciaux |
14100036 | Heures effectivement travaillées selon l’industrie, données mensuelles non désaisonnalisées |
14100201 | Emploi selon l’industrie, données mensuelles non désaisonnalisées |
14100222 | Emploi, rémunération horaire et hebdomadaire moyenne (incluant les heures supplémentaires) et heures hebdomadaires moyennes pour l’ensemble des industries excluant les entreprises non classifiées, données mensuelles désaisonnalisées |
14100287 | Caractéristiques de la population active, données mensuelles désaisonnalisées et tendance-cycle, cinq derniers mois |
14100292 | Caractéristiques de la population active selon le territoire, moyennes mobiles de trois mois, données désaisonnalisées et non désaisonnalisées, 5 derniers mois |
14100355 | Emploi selon l’industrie, données mensuelles désaisonnalisées et non désaisonnalisées, et tendance-cycle, cinq derniers mois |
16100048 | Ventes pour les industries manufacturières selon l’industrie et province, données mensuelles (dollars sauf indication contraire) |
18100004 | Indice des prix à la consommation mensuel, non désaisonnalisé |
18100204 | Indice des prix de vente de l’énergie électrique, mensuel |
18100205 | Indice des prix des logements neufs, mensuel |
20100008 | Ventes de commerce de détail par province et territoire |
20100074 | Commerce de gros, ventes |
21100019 | Enquête mensuelle sur les services de restauration et les débits de boissons |
24100002 | Nombre de véhicules voyageant entre le Canada et les États-Unis |
25100001 | Statistiques de l’énergie électrique, avec des données pour les années 1950 à 2007 |
25100015 | Production de l’énergie électrique, production mensuelle selon le type d’électricité |
34100003 | Permis de bâtir, valeur selon le secteur d’activité |
34100066 | Permis de bâtir, par type de structure et type de travaux |
34100158 | Société canadienne d’hypothèques et de logement, logements mis en chantier, toutes les régions, pour Canada et les provinces, désaisonnalisées au taux annuel, mensuel |
Note : SH : Système harmonisé. Source : Statistique Canada, compilation des auteurs. |
Les déflateurs sont principalement recueillis dans le cadre de programmes d’enquête au niveau du Canada pour les mesures de l’activité économique (tableau 2). À l’heure actuelle, Statistique Canada ne produit pas de déflateurs propres aux provinces et aux territoires pour les mesures en dollars courants du commerce international, des ventes du secteur de la fabrication, des ventes en gros, des ventes au détail ou de l’Enquête mensuelle sur les services de restauration. Pour recueillir les déflateurs, les indices de prix au niveau du Canada sont tirés d’enquêtes lorsqu’ils sont disponibles. Dans le cas de la fabrication, l’indice implicite de prix est calculé en tant que ratio entre la valeur nominale et la valeur réelle. Il existe des déflateurs pour les séries nominales depuis janvier 2002, sauf pour la fabrication. Pour la fabrication, l’Indice des prix des produits industriels (IPPI) par industrie, l’IPPI par groupe de produits et le ratio entre le PIB nominal et le PIB mensuel réel sont utilisés comme base de projection pour les déflateurs de l’industrie manufacturière.
Numéro de tableau | Titre du tableau |
---|---|
12100128 | Commerce international de marchandises par classification des produits, indices de prix et de volume, mensuel |
16100013 | Valeur réelle des ventes, des commandes, des stocks possédés et le ratio des stocks aux ventes des industries manufacturières, en dollars de 2012, désaisonnalisées |
16100047 | Stocks, ventes, commandes et rapport des stocks sur les ventes pour les industries manufacturières, selon l’industrie (dollars sauf indication contraire) |
18100004 | Indice des prix à la consommation mensuel, non désaisonnalisé |
18100029 | Indice des prix des produits industriels, par principaux groupes de produits, mensuel |
18100032 | Indice des prix des produits industriels, par industrie, mensuel |
20100003 | Ventes de grossistes, prix et volume, selon l’industrie, désaisonnalisées |
20100038 | Commerce de détail, ventes, dollars enchaînés et indices de prix, inactif |
20100051 | Commerce de gros, ventes, dollars enchaînés et indices de prix, inactif |
20100078 | Ventes au détail, prix et volume, désaisonnalisé |
36100434 | Produit intérieur brut (PIB) aux prix de base, par industriel, mensuel |
Note : SH : Système harmonisé. Source : Statistique Canada, compilation des auteurs. |
Pour combiner les données provinciales et les données des déflateurs afin de créer l’ensemble de données d’entrée, il y a quatre étapes :
- Assembler les données. Les tableaux de l’ECDS sont filtrés pour sélectionner les données désirées. Seules les variables avec des données continues sont sélectionnées. Les séries pouvant faire l’objet de suppression sont exclues, mais les séries comportant des valeurs nulles sont incluses. Les séries pouvant faire l’objet de suppression sont généralement des séries aux valeurs plus petites, ce qui signifie qu’elles contiennent moins de renseignements sur les fluctuations économiques agrégées. Bien qu’il existe des méthodes pour interpoler ces points de données, si la suppression se produit au cours du dernier mois, une prévision serait nécessaire pour remplir le point de données supprimé. Étant donné que l’indice est en cours de construction pour fournir des renseignements sur le plus grand choc ayant frappé l’économie canadienne depuis la Seconde Guerre mondiale, on juge qu’il n’est pas souhaitable d’inclure des séries comportant des valeurs prévues.
- Désaisonnaliser les séries de données. Ce ne sont pas toutes les séries qui sont fournies sur une base désaisonnalisée. Il y a au total 966 séries qui sont désaisonnalisées pour être utilisées dans l’indicateur. Étant donné le nombre élevé de séries, les options automatiques de l’algorithme ARIMA-SEATS du progiciel R relatif à la saisonnalité sont utilisées pour supprimer la saisonnalité. Les paramètres saisonniers sont déterminés en fonction des séries chronologiques mensuelles disponibles jusqu’en décembre 2019. Dans le cas où les séries chronologiques ne couvrent pas toute la période, comme les séries interrompues, les données jusqu’à la période la plus récente sont utilisées pour déterminer les options de désaisonnalisation.
- Afin de s’assurer que les séries désaisonnalisées sont de bonne qualité, elles ont été validées par diverses mesures de qualité. Cela inclut notamment vérifier la présence de saisonnalité, la quantité de saisonnalité stable présente par rapport à la quantité de saisonnalité évolutive (M7), l’absence d’effets saisonniers dans la composante irrégulière, l’uniformité de la série désaisonnalisée par rapport à sa forme brute et de contrôler le nombre de valeurs aberrantes détectées automatiquement par ARIMA-SEATS jusqu’à un maximum de cinq. Les séries qui se sont avérées non saisonnières (125 séries) sont conservées sous leur forme brute. Les séries désaisonnalisées dont la qualité est médiocre (183 séries) sont éliminées de l’ensemble de données avant l’estimation.
- Coupler les données. Après la désaisonnalisation, les données sont couplées au besoin. Lorsqu’il existe des périodes de chevauchement, des liens sont établis en traitant les données comme des indices et en les enchaînant rétrospectivement sur les périodes historiques. S’il n’existe pas de périodes de chevauchement, les valeurs de niveau sont jointes « telles quelles ».
- Appliquer les déflateurs. Si nécessaire, des déflateurs sont appliqués aux séries en dollars courants ou aux séries de prix pour produire des variables relatives des prix.
L’ensemble de données complet avant le filtrage contient des séries désaisonnalisées et non désaisonnalisées, des séries nominales et des séries déflatées propres à la province et au territoire. Pour modéliser l’activité économique provinciale et territoriale, des séries en unités naturelles (p. ex. employés, heures travaillées), des séries déflatées, des taux (p. ex. le taux de chômage) et les prix relatifs sont sélectionnés.
3 Estimation
L’objectif est d’estimer les séries chronologiques mensuelles pour l’activité économique agrégée dans les provinces et les territoires en tant que fonction des séries chronologiques économiques mensuelles provinciales et territoriales disponibles :
La mesure la plus couramment citée de l’activité économique agrégée est la mesure du PIB réel décrite dans le Système de comptabilité nationale de 2008 (Nations Unies, 2010)Note . Au niveau de l’ensemble du Canada, la fonction pour la transformation des séries de données d’entrée en PIB réel mensuel est fondée sur des méthodologies et des points de repère propres à l’industrie qui ont été élaborés et enrichis au fil du temps. Les méthodologies utilisent diverses sources de données pour estimer les variations de la production brute qui servent d’approximation pour le PIB réel. Les approximations sont combinées à des points de repère annuels du PIB réel pour produire la série mensuelle du PIB réel. Dans de nombreux cas, une mesure directe de la production brute est disponible. Toutefois, dans certaines industries, aucune mesure directe de la production n’est disponible et les estimations sont produites au moyen d’autres sources de données, comme l’emploi (Statistique Canada, 2020b)Note . Cette méthodologie forme la fonction dans laquelle les séries mensuelles sont placées pour produire le PIB réel mensuel du Canada.
La difficulté en ce qui concerne mesurer l’activité économique agrégée des provinces et des territoires est le fait que la fonction pour les provinces et les territoires est inconnue et que la série désirée, est également inconnue.
Puisque le but est d’estimer , si un proche substitut existait, il pourrait servir d’instrument pour le vrai . La fonction pour combiner des renseignements mensuels afin de produire une mesure agrégée de l’activité économique pourrait alors être approximative. Bien qu’il n’existe aucun substitut mensuel proche pour , le Système canadien des comptes macroéconomiques produit une mesure du PIB provincial et territorial à une fréquence annuelle. L’approche adoptée ici suppose donc que les données annuelles peuvent servir d’instrument pour aider à éclairer la structure de lorsque la moyenne des taux de croissance mensuels de la série d’entrées disponibles est calculée pour une année civile et utilisée pour estimer les valeurs des paramètres. Les paramètres de et les caractéristiques de variance de la série d’entrées mensuelles sont ensuite ajustées pour tenir compte de la différence de périodicité. Les indices mensuels de l’activité économique agrégée sont alors élaborés à partir des valeurs mensuelles estimées de .
L’utilisation d’une variable de fréquence plus basse comme instrument pour l’activité économique mensuelle réduit le nombre de degrés de liberté et introduit des problèmes liés au rythme des fluctuations mensuelles par rapport aux fluctuations annuelles. Ces problèmes auront des conséquences sur la capacité des modèles à produire une estimation mensuelle de l’activité économique agrégée. Les petits degrés de liberté et la covariance autour de la récession de 2008 auront tendance à produire des paramètres non statistiquement significatifs pour , si les variables explicatives ne sont pas touchées de façon importante par les fluctuations du cycle économique. En outre, les modèles peuvent avoir tendance à sélectionner un nombre plus faible d’entrées à une fréquence annuelle qu’il n’est nécessaire pour expliquer la variation mensuelle, car d’importantes fluctuations mensuelles peuvent être masquées par une agrégation à une fréquence plus faible. De plus, les changements liés aux prix, aux ventes/à la production et à l’emploi se produiront simultanément à une fréquence annuelle. Toutefois, à une fréquence mensuelle, ces fluctuations peuvent ne pas s’aligner.
Étant donné qu’une conversion de la fréquence annuelle à une fréquence mensuelle est nécessaire pour générer les valeurs estimées désirées, la stratégie de modélisation comprend certaines approches qui préfèrent capturer davantage de variation dans les données plutôt que de se concentrer uniquement sur la parcimonie des modèles. Cela ne veut pas dire que les modèles sont produits de manière ponctuelle. Au contraire, les critères de sélection, comme la maximisation d’un R carré ajusté, sont utilisés en parallèle avec des stratégies de modélisation de type général ou spécifique plus traditionnelles.
En résumé, parce que la forme fonctionnelle pour la transformation des données mensuelles en mesures agrégées de l’activité économique est inconnue, et parce que les valeurs réelles de la série sont également inconnues, la meilleure chose possible est d’approcher le vrai . Cela signifie que la série ressemblera fortement à une série sur le PIB réel, mais ne sera pas une véritable mesure du PIB mensuel réel. Elle sera plutôt une estimation de l’indice d’activité économique qui correspond aux conditions macroéconomiques dans les provinces et les territoires.
3.1 Stratégie d’estimation
La fonction est un ensemble d’instructions pour transformer un grand nombre de données d’entrée en une seule série. Dans cet article, on suppose que la fonction peut être basée de façon approximative sur une combinaison linéaire d’entrées et que les entrées peuvent être sélectionnées soit en sélectionnant un sous-ensemble des données disponibles, soit en créant une combinaison de toutes les séries de données d’entrée. Ci-dessous, trois approches sont explorées : 1) un modèle simple; 2) l’ACP; et 3) le LASSO. Le modèle simple et le modèle LASSO relèvent de la première catégorie, tandis que l’ACP appartient à la deuxième catégorie.
Les hypothèses et la mise en œuvre des modèles sont examinées en détail ci-après. Dans toutes les stratégies de modélisation, les étapes suivantes sont suivies pour estimer les valeurs des indices dans tous les cas :
- 1 : Préparer les données d’entrée.
L’ensemble de données d’entrée comporte 1 341 séries qui sont distribuées inégalement à travers les provinces et les territoires (tableau 3). Toutes les séries n’ont pas la même utilité pour modéliser l’activité économique agrégée. Dans les cas où la désaisonnalisation a échoué, les séries sont supprimées. De même, les séries comportant des valeurs nulles sont supprimées. Ces séries ont tendance à être des séries où les valeurs nulles sont entrecoupées par des valeurs nominales. Dans ces cas, les valeurs désaisonnalisées peuvent être négatives, le taux de croissance ou les transformations des différences logarithmiques peuvent ne pas fonctionner, et les séries ont une valeur douteuse en ce qui concerne leur utilité comme indicateur permanent de l’activité économique. Dans l’ensemble, 198 variables sont abandonnées pour ces raisons.
Vecteurs de départ | Avec 0 | Échec de la DS | Non renouvelé | 15 principaux vecteurs | 25 principaux vecteurs | Vecteurs pour le LASSO | Vecteurs pour l’ACP | |
---|---|---|---|---|---|---|---|---|
Terre-Neuve-et-Labrador | 108 | 3 | 8 | 8 | 15 | 25 | 83 | 73 |
Île-du-Prince-Édouard | 101 | 12 | 15 | 20 | 12 | 20 | 65 | 57 |
Nouvelle-Écosse | 115 | 2 | 14 | 14 | 15 | 25 | 84 | 74 |
Nouveau-Brunswick | 115 | 1 | 12 | 13 | 15 | 24 | 81 | 72 |
Québec | 131 | 1 | 10 | 11 | 18 | 29 | 97 | 86 |
Ontario | 133 | 0 | 11 | 11 | 18 | 30 | 99 | 87 |
Manitoba | 120 | 1 | 6 | 6 | 17 | 28 | 94 | 83 |
Saskatchewan | 118 | 0 | 11 | 11 | 16 | 26 | 85 | 75 |
Alberta | 122 | 0 | 8 | 8 | 17 | 27 | 91 | 81 |
Colombie-Britannique | 122 | 0 | 8 | 8 | 17 | 28 | 92 | 81 |
Yukon | 63 | 22 | 20 | 26 | 6 | 10 | 31 | 27 |
Territoires du Nord-Ouest | 59 | 27 | 29 | 31 | 5 | 7 | 23 | 21 |
Nunavut | 46 | 29 | 29 | 32 | 2 | 4 | 11 | 9 |
Total | 1 353 | 98 | 181 | 199 | 173 | 283 | 936 | 826 |
Note : LASSO : moindre contraction absolue et opérateur de sélection; ACP : analyse en composantes principales; DS : désaisonnalisation. Source : Statistique Canada, compilation des auteurs. |
L’ensemble de données d’entrée filtré contient alors 1 143 séries. Cependant, les séries sont généralement rapportées en niveaux (p. ex. heures travaillées ou ventes manufacturières en dollars enchaînés) et présentent de fortes tendances au cours de la période d’échantillonnage. Pour tenir compte des tendances, les séries sont transformées en taux de croissance d’un mois à l’autre. Ces taux de croissance seront finalement comparés aux mesures de la croissance du PIB réel, et ils ont l’avantage d’être liés par -100 % pour le déclin maximumNote . Les taux de croissance pour la série sont censés être stationnaires en matière de covariance.
Pour utiliser la série dans l’estimation, toutes les séries sont centrées et mises à l’échelle pour avoir une variance au niveau des unités à une fréquence mensuelle. Ce processus de normalisation est appliqué aux variables afin d’éviter que des variables dont les valeurs unitaires sont naturellement plus élevées n’affectent les résultats. Étant donné que les séries chronologiques mensuelles peuvent avoir une forte variabilité, et parce que les périodes de chocs économiques comme les récessions peuvent produire des points de données aberrants, toutes les séries sont « winsorisées » (ou tronquées des valeurs extrêmes supérieures et inférieures) avant l’estimation. Cela empêche les points de données extrêmes d’affecter les résultats. Pour créer les indices mensuels, les valeurs des paramètres provenant des modèles basés sur les données obtenues par winsorisation sont combinées avec des données non-winsorisées, ce qui permet aux valeurs plus importantes d’avoir toute leur influence lorsque de grands chocs surviennent.
Enfin, les séries les plus bruyantes sont supprimées. Dans le cas de l’ACP, la tranche supérieure de 25 % des séries selon la variance est éliminée par province, tandis que pour le LASSO, la tranche supérieure de 15 % des séries selon la variance est éliminée. Ces seuils sont arbitraires, mais leur imposition a permis d’améliorer la capacité des modèles d’éclairer sur l’activité agrégée (c.-à-d. améliorer le signal par rapport au bruit) et d’améliorer la cohérence des résultats entre les méthodes. Après ajustement pour les séries à variation élevée, il y a un total de 928 variables d’entrée pour le LASSO et 820 pour l’ACP. Le Nunavut possède le plus petit nombre de séries disponibles, tandis que l’Ontario et le Québec en comptent le plus grand nombre.
- 2 : En utilisant les taux de croissance winsorisés, calculer la moyenne annuelle des taux de croissance mensuels qui seront utilisés dans les modèles.
- 3 : Estimer les paramètres du modèle.
Cette estimation est fondée sur la combinaison de la croissance du PIB réel et des moyennes annuelles des séries mensuelles de données d’entrée pour les années 2002 à 2018. La croissance réelle du PIB n’est ni mise à l’échelle ni centrée. En utilisant la croissance réelle du PIB comme variable cible et les moyennes annuelles des séries mensuelles comme variables d’entrée, la forme fonctionnelle de est estimée. Dans tous les modèles employés, on suppose qu’une combinaison linéaire de variables d’entrée peut être utilisée pour transformer la multiplicité des variables d’entrée en une mesure unique de l’activité agrégée. Dans le cas du modèle simple et du LASSO, un sous-ensemble des variables est utilisé directement. Dans le cas de l’ACP, les 10 premières composantes principales sont utilisées comme point de départ. On présume aussi que les MCO peuvent être utilisés pour générer des contributions permettant de combiner des variables d’entrée. En utilisant des méthodes de régression pour combiner les données d’entrée, on impose une hypothèse supplémentaire comme quoi les structures économiques sont, en moyenne, les mêmes pendant toute la période d’échantillonnage.
- 4 : Utiliser le modèle pour estimer les taux de croissance mensuels.
Étant donné que toutes les approches peuvent être considérées comme une régression des MCO avec des données d’entrée centrées, l’interception peut être interprétée comme le taux de croissance annuel moyen du PIB réel entre 2002 et 2018. Les données d’entrée sélectionnées (séries chronologiques mensuelles ou composantes principales) produisent des fluctuations pour ce taux de croissance moyen. Pour 2019 et 2020, on suppose que le taux de croissance moyen entre 2002 et 2018 est représentatif de la croissance sous-jacente.
Pour produire des estimations mensuelles, il est nécessaire d’ajuster les estimations des paramètres ou les séries mensuelles pour tenir compte de la différence à l’égard de la périodicité. La constante du modèle est ajustée à une fréquence mensuelle basée sur le taux de croissance mensuel composé qui est équivalent à l’estimation annuelle :
Pour estimer les fluctuations mensuelles autour du taux de croissance tendanciel, les séries de données d’entrées brutes sont utilisées. Cela permet aux fluctuations importantes dans la série chronologique de présenter toutes leurs répercussions lorsque les chocs économiques, comme les récessions ou les cycles de prix des produits de base, ont des répercussions sur les économies provinciales et territoriales. Les variations des données d’entrée mensuelles sont ajustées pour correspondre à l’écart annuel avant utilisation. Les estimations de régression des MCO sont basées sur le ratio cov(x,y)/var(x). Dans le contexte actuel, l’agrégation au fil du temps réduit la variance de la matrice X. Pour tenir compte de cela, la variance des données mensuelles est rééchelonnée de façon à correspondre à la variance des données annuelles pour chaque série avec l’équation suivante :
- 5 : Générer les indices de niveau
Les valeurs ajustées provenant des modèles sont des estimations de la croissance mensuelle de l’activité économique. Elles peuvent être transformées en indices en ajoutant 1 pour créer une valeur de liaison pour un indice en chaîne. Le niveau de l’indice est ensuite calculé en enchaînant les valeurs à partir de janvier 2002.
Les estimations du taux de croissance sont associées à un intervalle de confiance, car il existe une incertitude quantifiable qui découle du modèle. Il existe également une incertitude non quantifiable qui découle d’une possible erreur de spécification du modèle. Pour produire un indice de niveau, il est nécessaire de supposer que les estimations du taux de croissance sont suffisamment précises pour pouvoir être utilisées pour l’enchaînement, même si les erreurs sont aggravées au fil du temps. Il s’agit là d’une hypothèse solide, mais elle est compatible avec la façon dont les valeurs moyennes des données d’enquête sur les prix, les valeurs et les quantités sont combinées pour produire des indices de quantité enchaînée ou de prix enchaînés.
L’utilisation de plusieurs modèles à l’étape 3 conduira finalement à la présentation de différents types de l’indice d’activité. Dans le contexte actuel, où les modèles statistiques sont utilisés pour donner des renseignements sur l’activité économique dans un environnement où ils ne peuvent être mis en œuvre de manière optimale, la création de plusieurs versions de l’indice de l’activité joue un rôle important. Parce que la vraie valeur pour inconnue, valider et est difficile. Les données de sortie des différentes méthodes fournissent une forme naturelle de confrontation des données qui aide à évaluer l’acceptabilité et la généralisation des estimations.
3.1.1 Modèle simple
Le modèle simple part du principe que l’emploi total, les exportations totales et les ventes totales au détail contiennent les renseignements appropriés pour comprendre les fluctuations économiques agrégées. Cette hypothèse est probablement trop hardie, car plus de trois données d’entrée sont nécessaires pour saisir pleinement les complexités de l’activité économique agrégée. Toutefois, le modèle est cohérent dans l’ensemble des provinces et des territoires, et il est facile de le comprendre. Il est donc utile en tant que base contre laquelle des méthodes plus complexes peuvent être évaluées. L’approche simple représente également une méthode qui peut être considérée comme compatible avec les types de bases de projection utilisées pour déduire les mouvements de la production brute qui sont utilisés comme données d’entrée pour le PIB mensuel du Canada (Statistique Canada, 2020b).
Comme les séries n’ont pas de structure naturelle d’agrégation pour les combiner, les régressions sont utilisées pour déterminer les contributions relatives des variables plutôt qu’une formule de calcul de l’indice. Étant donné que les données d’entrée sont censées être les données d’entrée nécessaires, les trois séries sont incluses indépendamment de leur importance statistique en matière de régressions.
3.1.2 Analyse des composantes principales
L’ACP est une technique de réduction variable qui vise à expliquer la variance d’un ensemble de données particulier en utilisant un plus petit nombre de composantes principales (OCDE 2008, Jollife 2002). Un ensemble de données avec des variables p , peut être transformé pour produire les composantes principales p :
où
Les composantes principales sont calculées comme des combinaisons linéaires des variables d’entrée (la série mensuelle). La première composante principale explique la plus importante proportion de la variance des variables d’entrée. C’est le vecteur propre associé à la plus grande valeur propre. La deuxième composante principale est orthogonale (sans corrélation) avec la première composante principale et est le vecteur propre associé à la deuxième plus grande valeur propre. Elle explique la deuxième composante la plus importante des variables d’entrée. On peut donc dire qu’elle mesure une différente dimension statistique des séries disponibles. La troisième composante principale est orthogonale aux deux premières et mesure la troisième plus grande proportion de variance dans les données. Et ainsi de suite jusqu’à la composante principale.
Pour mettre en œuvre l’ACP ici, les principales composantes utilisées pour l’estimation du modèle et les chargements sont déterminées en employant la série chronologique mensuelle de la variance winsorisée et centrée au niveau des unités. Les chargements sont ensuite appliqués à la série brute non winsorisée pour produire les composantes principales brutes utilisées pour prédire les taux de croissance mensuels.
Lorsque l’ACP fonctionne bien, une grande partie de la variance d’un ensemble de données peut être expliquée par les premières composantes principales, et seules les premières composantes principales sont utilisées pour l’analyse. Malheureusement, dans le cas de l’ensemble de données d’entrée pour les économies provinciales et territoriales, l’ACP ne fonctionne pas bien pour réduire la portée des renseignements contenus dans l’ensemble de données (tableau 4). La première composante principale représente généralement moins de 10 % de la variation dans l’ensemble de données. De plus, lorsqu’on établit une moyenne pour produire une estimation de la fréquence annuelle, la première composante principale ne correspond pas bien à la croissance annuelle du PIB réel pour la plupart des provinces et des territoires (tableau 5).
Composantes principales | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | |
Terre-Neuve-et-Labrador | 10,5 | 16,2 | 21,0 | 25,4 | 29,7 | 33,3 | 36,6 | 39,7 | 42,6 | 45,3 |
Île-du-Prince-Édouard | 12,1 | 19,5 | 25,7 | 31,2 | 35,2 | 39,1 | 42,7 | 46,0 | 49,2 | 52,2 |
Nouvelle-Écosse | 9,0 | 15,2 | 20,6 | 24,9 | 28,5 | 32,0 | 35,2 | 38,3 | 41,1 | 43,8 |
Nouveau-Brunswick | 9,6 | 16,4 | 21,3 | 25,8 | 29,8 | 33,6 | 37,3 | 40,4 | 43,4 | 46,3 |
Québec | 7,0 | 13,0 | 17,8 | 21,9 | 25,5 | 28,7 | 31,6 | 34,3 | 37,0 | 39,7 |
Ontario | 8,9 | 14,6 | 19,3 | 23,1 | 26,4 | 29,6 | 32,5 | 35,3 | 37,8 | 40,2 |
Manitoba | 7,9 | 13,6 | 19,2 | 23,8 | 27,3 | 30,7 | 34,0 | 37,2 | 39,9 | 42,6 |
Saskatchewan | 8,6 | 14,5 | 19,7 | 24,4 | 28,7 | 32,0 | 35,1 | 38,0 | 40,9 | 43,6 |
Alberta | 10,5 | 16,4 | 21,5 | 25,9 | 29,5 | 33,0 | 36,1 | 39,0 | 41,7 | 44,3 |
Colombie-Britannique | 8,6 | 14,7 | 20,2 | 25,3 | 29,4 | 32,8 | 35,8 | 38,6 | 41,3 | 44,0 |
Yukon | 14,2 | 24,8 | 33,8 | 39,8 | 45,1 | 50,2 | 54,9 | 59,3 | 63,4 | 67,5 |
Territoires du Nord-Ouest | 17,8 | 30,6 | 37,6 | 44,3 | 50,3 | 56,1 | 61,4 | 66,6 | 71,4 | 76,1 |
Nunavut | 35,8 | 49,4 | 62,6 | 73,6 | 83,7 | 92,5 | 98,1 | 99,6 | 100,0 | Note ...: n'ayant pas lieu de figurer |
... n'ayant pas lieu de figurer Source : Statistique Canada, compilation des auteurs. |
Les corrélations indiquent qu’en dehors de l’Alberta, de la Colombie-Britannique et de l’Ontario, le fait d’utiliser uniquement la première composante principale ne produira pas un indice d’activité qui fournit une mesure adéquate pour déterminer le rendement des provinces et des territoires en fonction des fluctuations mensuelles agrégées. Par conséquent, un indice d’activité basé uniquement sur la première composante principale, comme celui produit par le la Federal Reserve Board of Chicago (Federal Reserve Board of Chicago 2020, Brave et Butters 2010, Evans et Pham-Kanter 2002), n’est pas poursuivi ici.
Indice winsorisé | Indice non winsorisé | |
---|---|---|
Terre-Neuve-et-Labrador | -0,349 | -0,256 |
Île-du-Prince-Édouard | -0,199 | -0,307 |
Nouvelle-Écosse | 0,531 | 0,491 |
Nouveau-Brunswick | -0,709 | -0,673 |
Québec | 0,657 | 0,661 |
Ontario | 0,775 | 0,778 |
Manitoba | 0,562 | 0,567 |
Saskatchewan | 0,477 | 0,338 |
Alberta | 0,937 | 0,940 |
Colombie-Britannique | 0,840 | 0,848 |
Yukon | 0,177 | 0,251 |
Territoires du Nord-Ouest | 0,423 | 0,422 |
Nunavut | 0,355 | 0,444 |
Source : Statistique Canada, compilation des auteurs. |
Bien que la première composante principale ait des difficultés à corréler avec les fluctuations annuelles du PIB réel, cela ne signifie pas qu’il n’y a aucun renseignement dans les premières composantes principales pour expliquer la croissance du PIB réel. Par conséquent, pour générer un modèle basé sur les composantes principales, les régressions sont effectuées sur toutes les combinaisons des 10 premières composantes principales en tant que variables explicatives pour expliquer la croissance du PIB réel. La régression qui maximise le R carré ajusté est ensuite sélectionnée en tant que modèle préféré. Cela produit 13 modèles qui fonctionnent raisonnablement bien pour expliquer la croissance du PIB réel. De plus, les modèles fonctionnent généralement bien pour expliquer la récession de 2008 et d’autres fluctuations propres à une province ou à un territoire.
3.1.3 Moindre contraction absolue et opérateur de sélection
Le LASSO est la solution à un problème d’optimisation restreint semblable aux MCO. Sous une régression linéaire classique, est une matrice n x p contenant les variables prédictrices utilisées pour expliquer la variation dans un vecteur cible de longueur n. Les coefficients pour la régression sont alors la solution au problème qui cherche à réduire la somme des erreurs quadratiques entre et une combinaison linéaire des variables dans :
Le LASSO (Tibshirani 1996) fait partie d’une classe d’estimateurs qui cherche à pénaliser l’estimateur des MCO pour ajustement excessif (c.-à-d. inclure trop de variables) au moyen de son paramètre de régulation . On pourrait comparer cela à l’utilisation d’un R carré ajusté ou d’un critère de renseignement pour pénaliser l’inclusion d’un trop grand nombre de variables explicatives. Cependant, cela va plus loin que de pénaliser à cause de variables explicatives supplémentaires quand on regarde la qualité du modèle. Cela sélectionne des variables pertinentes. Le LASSO est la solution pour :
Le paramètre contrôle la force de la pénalité; plus la valeur de lambda est grande, plus la valeur du rétrécissement est importante. L’algorithme LASSO peut uniquement inclure des valeurs pour jusqu’à un total absolu précis. Par conséquent, le LASSO fixe à 0 les coefficients variables moins importants. On peut considérer cela comme semblable au type de résultat trouvé en employant une stratégie de modélisation générale à spécifique/guidée par descriptions approximatives, mais qui est applicable à plus grande échelle. Le résultat est une méthode pour traiter de grands ensembles de données où un grand nombre de prédicteurs peuvent être inclus, et l’algorithme sélectionnera ceux dont les propriétés de covariance sont les plus importantes pour prédire la variable cible ( ).
Le LASSO a lui aussi des limites. Dans les cas où les groupes de variables prédictives sont fortement corrélés les uns aux autres, le LASSO tend à garder une variable de chaque groupe et à contracter le coefficient des autres variables à zéro. Et dans d’autres cas, lorsque l’ensemble de données a un petit n et un grand p, le LASSO sélectionne au maximum n variables avant d’être saturé. Cependant, il peut y avoir plus de variables n avec un coefficient qui n’est pas égal à zéro dans le vrai modèle.
La méthode elastic-net (Zou et Hastie, 2005) est une extension du LASSO. En contrôlant le poids de pénalité , le modèle elastic-net stabilise la sélection des variables à partir d’un groupe de variables corrélées et supprime la limite au nombre de variables sélectionnées. Les coefficients sont estimés comme suit :
Où est la pondération de pénalité. Comme est égal à 1, le modèle elastic-net est le même que pour le modèle LASSO et, comme est proche de 1, le modèle elastic-net se comporte de façon semblable au LASSO, mais élimine le comportement problématique causé par de fortes corrélations entre les variables.
Les données de sortie du LASSO en matière du nombre de variables sélectionnées et de leur importance statistique ont été soigneusement étudiées. Dans presque tous les cas où le LASSO fonctionnait, le LASSO semble inclure dans le modèle des variables qui ne sont pas statistiquement importantes. Pour s’assurer que la relation entre le y cible et les variables explicatives est justifiable avec un meilleur résultat statistique, une analyse graduelle par régression avec sélection descendante est utilisée sur les variables sélectionnées par le LASSO pour enlever les variables non significatives du modèle.
L’analyse graduelle par régression est une méthode qui examine l’importance statistique de chaque variable indépendante au sein du modèle. Elle construit un modèle en ajoutant successivement (sélection ascendante) ou en supprimant (sélection descendante) des variables en fonction des statistiques t de leurs coefficients estimés. La méthode d’élimination descendante commence par l’inclusion de toutes les variables dans le modèle, puis chaque variable est supprimée une par une, pour tester son importance. Les variables qui ne sont pas statistiquement significatives sont enlevées du modèle.Le modèle LASSO n’a pas choisi de variables pour le Nouveau-Brunswick, la Nouvelle-Écosse, l’Ontario et les Territoires du Nord-Ouest. La méthode elastic-net est utilisée à sa place pour ces provinces et territoires. Et pour les deux autres territoires, le Yukon et le Nunavut, une analyse graduelle par régression manuelle est effectuée.
Dans les deux méthodes, LASSO et elastic-net, la validation croisée du progiciel caret R est utilisée pour ajuster les paramètres lambda et alpha. La validation croisée utilise une technique de prévision continue de l’origine (Hyndman et Athanasopoulos, 2014) au lieu de l’échantillonnage aléatoire simple. Cette technique est propre aux ensembles de données des séries chronologiques.
4 Évaluation mensuelle de l’indice
Les trois approches présentent en outre des points forts et des points faibles qui leur sont propres, et qui ont une incidence sur leur utilisation (tableau 6). Les indices simples et le LASSO ont pour avantage que leurs modèles sont parcimonieux et que les indices qu’ils produisent sont moins bruyants que les indices fondés sur l’ACP. Cependant, ces indices sont basés sur un ensemble de variables très réduit, qui sont souvent non statistiquement significatives pour les indices simples dans les régressions annuelles. Ces indices tendent aussi à mettre l’accent sur les séries relatives à l’emploi plutôt que sur un large éventail d’activités économiques et peuvent, par conséquent, ne pas présenter de valeurs explicatives idéales des fluctuations mensuelles de l’activité, si les variations de la production ne rendent pas compte au même moment des variables d’emploi.
L’indice ACP a pour avantage que la méthodologie est saine et bien comprise. Il fonctionne pour toutes les provinces et tous les territoires. Cependant, il produit les indices d’activité les plus bruyants, rendant leur interprétation difficile; de plus, dans certains cas (p. ex. T.-N.), l’indice peut diminuer brusquement. Les indices ACP sont aussi combinés en fonction de la maximisation du R carré ajusté d’une régression à l’autre. Cela produit une combinaison linéaire des composantes principales qui sont statistiquement significatives et non significatives. Ces inclusions préfèrent ajouter des renseignements supplémentaires qui incluent un certain bruit, car il n’est pas clair que les données à une fréquence annuelle représentent la variabilité d’un mois à l’autre.
Critère | Indice simple | Indice ACP | Indice pondéré | Indice LASSO |
---|---|---|---|---|
Données d’entrée cohérentes pour tous les niveaux géographiques | Oui | Non | Non | Non |
Modèle-types cohérents pour tous les niveaux géographiques | Oui | Oui | Oui | Non |
Spécification du modèle | Trois données d’entrée, quelques variables non significatives | Nombre variable de composantes principales. Quelques variables non significatives | Combinaison des indices simples et ACP | Sélection de données d’entrée variable |
Adéquation du modèle | Adéquation du modèle peut varier entre les provinces et les territoires | Adéquation généralement bonne pour l’échantillon | Adéquation pour l’échantillon améliorée par rapport aux indices simples et ACP | Adéquation généralement bonne pour l’échantillon |
Intelligibilité | Données d’entrée et contributions faciles à comprendre | Difficile de comprendre ce qui contribue aux variations
Difficile d’interpréter les composantes principales Indices à variabilité élevée |
Difficile de comprendre ce qui contribue aux variations | Données d’entrée fondées sur des corrélations
Contributions pouvant être interprétées Indice à faible variance |
Adéquation du modèle | Ces modèles peuvent ne pas être efficaces selon l’importance statistique
Les données d’entrée reflètent les attentes pour les variables importantes. |
Ces modèles peuvent ne pas être efficaces selon l’importance statistique
Utilisation exhaustive des données d’entrée |
Hérite des propriétés des indices de données d’entrée | Approche de modélisation non adaptée à la configuration actuelle |
Note : ACP : analyse en composantes principales; LASSO : moindre contraction absolue et opérateur de sélection. Source : Statistique Canada, compilation des auteurs. |
La combinaison des indices fournit une méthode supplémentaire pour leur utilisation. Puisque l’indice simple est relativement stable, mais se concentre sur un nombre limité de séries fondamentales, et que l’indice ACP est plus variable, mais comprend des combinaisons linéaires de toutes les entrées, ces séries sont combinées pour fournir un indice pondéré présentant de meilleures caractéristiques que les composantes. Pour toutes les méthodes, les indices produits génèrent généralement des types similaires de renseignements sur les cycles économiques et les principaux chocs économiques dans les provinces et les territoires. Comme pour les coefficients de régression, la croissance annuelle du PIB réel est utilisée comme comparaison, car elle constitue la principale source d’activité économique agrégée qui est disponible pour les provinces et les territoires. Pour combiner l’indice ACP et l’indice simple, les valeurs de degré de liberté entre 1 % et 100 % sont utilisées pour créer des indices pondérés comme suit :
Le degré de liberté correspondant à l’indice pondéré qui a la plus forte corrélation avec la croissance du PIB réel est alors sélectionné.
Les méthodes utilisées pour produire des indices mensuels donnent généralement des types semblables de renseignements sur les cycles économiques et les chocs économiques majeurs dans les provinces et les territoires. À titre d’exemples, les indices pour l’Alberta (panel 1) et Terre-Neuve-et-Labrador (panel 2) sont présentés ci-dessous.
Dans le cas d’une économie plus vaste, comme celle de l’Alberta, toutes les approches donnent des renseignements similaires sur les périodes de croissance ou de déclin, mais l’ampleur des cycles peut varier selon la méthodologie. En général, les indices basés sur l’ACP ont la plus grande variabilité, alors que l’indice simple a le moins de variabilité. Dans certains cas, comme l’indice ACP pour Terre-Neuve-et-Labrador, le modèle ne produit pas un résultat raisonnable. Dans ces cas, l’indice ne sera pas rendu disponible et est jugé impropre à l’utilisation. Néanmoins, lorsque les indices semblent présenter les caractéristiques appropriées, il y a une forte corrélation entre les mesures de l’activité économique implicite et le mouvement des indices dans le temps correspond à ce que l’on sait sur la performance économique des provinces et des territoires.
De plus, les comparaisons avec les estimations sous-annuelles du PIB réel pour l’Ontario et le Québec montrent que les taux de croissance d’une année à l’autre sont fortement corrélés, mais que les cycles économiques peuvent être accentués dans les indices d’activité. Les indices semblent donc saisir des renseignements pertinents pour les cycles économiques, les périodes de croissance plus forte ou plus faible et pour comprendre la performance économique. Ils ne correspondent toutefois pas directement au PIB réel et ne doivent pas être interprétés comme une mesure directe du PIB réel.Tableau de données du graphique 1
Indice d’activité basé sur les composantes principales | Indice simple | Indice pondéré | Indice basé sur le LASSO | |
---|---|---|---|---|
niveau de l'indice | ||||
01/01/2002 | 44,02 | 46,61 | 43,8 | 53,41 |
01/02/2002 | 42,57 | 47,96 | 43,94 | 54,03 |
01/03/2002 | 43,38 | 46,68 | 43,61 | 53,1 |
01/04/2002 | 43,66 | 47,1 | 43,95 | 52,9 |
01/05/2002 | 42,7 | 47,27 | 43,63 | 53,07 |
01/06/2002 | 46,2 | 48,41 | 45,75 | 54,21 |
01/07/2002 | 48,41 | 48,82 | 46,9 | 54,67 |
01/08/2002 | 49,49 | 51,78 | 48,98 | 56,37 |
01/09/2002 | 48,55 | 51,02 | 48,18 | 55,53 |
01/10/2002 | 48,16 | 51,42 | 48,23 | 55,81 |
01/11/2002 | 48,55 | 51,27 | 48,32 | 55,87 |
01/12/2002 | 51,29 | 51,54 | 49,6 | 56,95 |
01/01/2003 | 49,35 | 51,91 | 49,03 | 56,81 |
01/02/2003 | 50,07 | 50,62 | 48,62 | 56,36 |
01/03/2003 | 49,06 | 52,54 | 49,28 | 57,45 |
01/04/2003 | 46,89 | 51,99 | 48,06 | 57,38 |
01/05/2003 | 51,1 | 51,61 | 49,67 | 57,31 |
01/06/2003 | 51,11 | 51,9 | 49,84 | 57,42 |
01/07/2003 | 53,42 | 51,25 | 50,42 | 57,95 |
01/08/2003 | 54,38 | 50,81 | 50,55 | 57,93 |
01/09/2003 | 55,08 | 51,13 | 51,01 | 58,18 |
01/10/2003 | 58,9 | 53,63 | 53,94 | 60,27 |
01/11/2003 | 57,34 | 53,12 | 53,04 | 59,42 |
01/12/2003 | 58,65 | 51,93 | 52,87 | 58,7 |
01/01/2004 | 58,52 | 53,3 | 53,62 | 59,04 |
01/02/2004 | 57,42 | 52,46 | 52,71 | 58,44 |
01/03/2004 | 61,58 | 54,96 | 55,77 | 60,01 |
01/04/2004 | 63,78 | 57,09 | 57,86 | 61,91 |
01/05/2004 | 64,62 | 58,28 | 58,88 | 62,76 |
01/06/2004 | 63,31 | 58,73 | 58,64 | 62,47 |
01/07/2004 | 63,92 | 59,92 | 59,57 | 63,02 |
01/08/2004 | 67,74 | 61,08 | 61,74 | 63,31 |
01/09/2004 | 72,25 | 64,06 | 65,2 | 64,77 |
01/10/2004 | 69,04 | 63,96 | 63,93 | 64,7 |
01/11/2004 | 71,06 | 65,47 | 65,59 | 65,95 |
01/12/2004 | 75,37 | 68,87 | 69,24 | 67,56 |
01/01/2005 | 74,58 | 68,91 | 68,95 | 66,55 |
01/02/2005 | 78,88 | 70,83 | 71,74 | 68,35 |
01/03/2005 | 79,81 | 71,25 | 72,34 | 69,63 |
01/04/2005 | 83,03 | 74,76 | 75,64 | 70,38 |
01/05/2005 | 86,59 | 78,15 | 78,99 | 72,45 |
01/06/2005 | 86,26 | 77,58 | 78,53 | 72,65 |
01/07/2005 | 90,69 | 80,97 | 82,21 | 74,71 |
01/08/2005 | 92,54 | 82,08 | 83,57 | 75,23 |
01/09/2005 | 89,46 | 82,22 | 82,48 | 75,36 |
01/10/2005 | 93,96 | 83,52 | 84,98 | 76 |
01/11/2005 | 99,23 | 84,08 | 87,32 | 76,41 |
01/12/2005 | 105,42 | 86,85 | 91,27 | 77,9 |
01/01/2006 | 112,03 | 92,56 | 97,16 | 81,19 |
01/02/2006 | 124,82 | 97,78 | 104,99 | 86,05 |
01/03/2006 | 129,22 | 98,89 | 107,23 | 85,29 |
01/04/2006 | 131,71 | 104,09 | 111,37 | 87,32 |
01/05/2006 | 151,64 | 108,36 | 121,1 | 90,3 |
01/06/2006 | 157,75 | 114,43 | 127,09 | 92,96 |
01/07/2006 | 155,85 | 111,55 | 124,59 | 92,11 |
01/08/2006 | 154,08 | 110,1 | 123,06 | 91,1 |
01/09/2006 | 158,42 | 114,46 | 127,34 | 94,08 |
01/10/2006 | 164,81 | 114,27 | 129,37 | 95,42 |
01/11/2006 | 189,61 | 123,48 | 143,6 | 99,53 |
01/12/2006 | 182,2 | 129,73 | 145,46 | 100,77 |
01/01/2007 | 190,56 | 134,1 | 151,1 | 102,35 |
01/02/2007 | 198,82 | 136,14 | 155,18 | 103,41 |
01/03/2007 | 198,63 | 138,32 | 156,56 | 105,25 |
01/04/2007 | 199,1 | 134,66 | 154,32 | 102,72 |
01/05/2007 | 190,58 | 133,71 | 150,91 | 102,79 |
01/06/2007 | 206,86 | 138,25 | 159,3 | 104,63 |
01/07/2007 | 206,74 | 135,7 | 157,55 | 104,9 |
01/08/2007 | 221,09 | 137,19 | 163,15 | 106,49 |
01/09/2007 | 212,06 | 134,81 | 158,71 | 104,74 |
01/10/2007 | 212,26 | 137,38 | 160,52 | 105,98 |
01/11/2007 | 222,26 | 136,46 | 163,08 | 105,2 |
01/12/2007 | 214,99 | 134,42 | 159,43 | 105,75 |
01/01/2008 | 213,26 | 139,22 | 162,19 | 107,36 |
01/02/2008 | 210,38 | 137,17 | 159,88 | 105,66 |
01/03/2008 | 229,88 | 145,51 | 171,75 | 109,47 |
01/04/2008 | 227,03 | 147,08 | 171,93 | 111,48 |
01/05/2008 | 217,63 | 143,91 | 166,79 | 110,19 |
01/06/2008 | 224,1 | 146,92 | 170,9 | 111,12 |
01/07/2008 | 228,86 | 148,4 | 173,41 | 111,88 |
01/08/2008 | 231,95 | 154,54 | 178,56 | 113,96 |
01/09/2008 | 245,26 | 151,44 | 180,79 | 113,02 |
01/10/2008 | 251,6 | 152,78 | 183,68 | 113,92 |
01/11/2008 | 226,74 | 146,33 | 171,56 | 110,44 |
01/12/2008 | 199,86 | 140,83 | 159,28 | 106,41 |
01/01/2009 | 184,33 | 130,35 | 147,21 | 101,74 |
01/02/2009 | 152,56 | 123,85 | 132,29 | 98,07 |
01/03/2009 | 132,39 | 110,29 | 116,55 | 91,91 |
01/04/2009 | 120,77 | 104,76 | 108,86 | 88,75 |
01/05/2009 | 117,82 | 104,35 | 107,49 | 86,86 |
01/06/2009 | 111,94 | 97,83 | 101,34 | 84,4 |
01/07/2009 | 109,03 | 97,57 | 100,08 | 83,67 |
01/08/2009 | 96,8 | 87,94 | 89,64 | 79,63 |
01/09/2009 | 103,38 | 89,66 | 93,21 | 80,47 |
01/10/2009 | 95,74 | 87,62 | 89,09 | 78,73 |
01/11/2009 | 98,14 | 86,53 | 89,38 | 78,59 |
01/12/2009 | 101,93 | 86,01 | 90,52 | 78,65 |
01/01/2010 | 104,88 | 91,76 | 95,14 | 80,38 |
01/02/2010 | 101,29 | 91,16 | 93,4 | 79,83 |
01/03/2010 | 106,13 | 92,36 | 96 | 80,49 |
01/04/2010 | 112,77 | 93,93 | 99,46 | 82,04 |
01/05/2010 | 114,31 | 93,21 | 99,59 | 82,08 |
01/06/2010 | 114,69 | 95,96 | 101,43 | 83,79 |
01/07/2010 | 113,32 | 97,73 | 102,01 | 83,77 |
01/08/2010 | 114,88 | 97,17 | 102,26 | 83,54 |
01/09/2010 | 115,52 | 99,14 | 103,7 | 85,08 |
01/10/2010 | 123,24 | 102,62 | 108,72 | 87,49 |
01/11/2010 | 117,97 | 100,26 | 105,32 | 87,09 |
01/12/2010 | 124,56 | 105,13 | 110,76 | 89,72 |
01/01/2011 | 129,69 | 103,5 | 111,68 | 89,83 |
01/02/2011 | 139,07 | 106,75 | 117,11 | 92,08 |
01/03/2011 | 142,32 | 108,93 | 119,64 | 92,54 |
01/04/2011 | 150,84 | 113,07 | 125,29 | 94,7 |
01/05/2011 | 143,64 | 111,31 | 121,65 | 93,88 |
01/06/2011 | 159,07 | 118,1 | 131,44 | 97,47 |
01/07/2011 | 162,9 | 121,64 | 135,05 | 98,81 |
01/08/2011 | 170,97 | 121,2 | 137,58 | 99,78 |
01/09/2011 | 177,27 | 125,39 | 142,46 | 102,34 |
01/10/2011 | 181,7 | 126,83 | 144,91 | 103,3 |
01/11/2011 | 187,92 | 130,88 | 149,68 | 105,69 |
01/12/2011 | 202,43 | 135,47 | 157,58 | 108,6 |
01/01/2012 | 200,04 | 136,08 | 157,21 | 108,2 |
01/02/2012 | 203,94 | 137,33 | 159,33 | 107,93 |
01/03/2012 | 215,35 | 143,44 | 167,19 | 111,99 |
01/04/2012 | 231,23 | 147,11 | 174,84 | 113,99 |
01/05/2012 | 246,96 | 158,95 | 188 | 119,03 |
01/06/2012 | 245,54 | 163,36 | 190,57 | 121,09 |
01/07/2012 | 251,4 | 163,48 | 192,57 | 121,8 |
01/08/2012 | 255,07 | 167,99 | 196,83 | 123,66 |
01/09/2012 | 256,26 | 166,98 | 196,53 | 122,35 |
01/10/2012 | 256,04 | 163,98 | 194,41 | 121,8 |
01/11/2012 | 282,48 | 168,88 | 206,21 | 124,01 |
01/12/2012 | 257,26 | 162,99 | 194,31 | 121,25 |
01/01/2013 | 269,64 | 166,71 | 200,8 | 123,41 |
01/02/2013 | 278,58 | 174,14 | 208,79 | 126,47 |
01/03/2013 | 285,1 | 178,01 | 213,54 | 128,04 |
01/04/2013 | 284,24 | 178,9 | 213,88 | 129,26 |
01/05/2013 | 295,09 | 181,18 | 218,89 | 130,5 |
01/06/2013 | 276,77 | 180,16 | 212,47 | 129,64 |
01/07/2013 | 293,1 | 185,99 | 221,72 | 132,52 |
01/08/2013 | 308,64 | 190,45 | 229,75 | 134,29 |
01/09/2013 | 297,08 | 187,28 | 223,91 | 134,34 |
01/10/2013 | 303,6 | 193,58 | 230,35 | 136,04 |
01/11/2013 | 309,71 | 194,63 | 233,02 | 136,76 |
01/12/2013 | 300,19 | 192,49 | 228,53 | 136,8 |
01/01/2014 | 305,95 | 195,89 | 232,71 | 138,24 |
01/02/2014 | 331,2 | 199,63 | 243,35 | 139,67 |
01/03/2014 | 320 | 202,51 | 241,93 | 139,89 |
01/04/2014 | 306,86 | 206,6 | 240,59 | 141,57 |
01/05/2014 | 338,35 | 210,18 | 253,38 | 144,25 |
01/06/2014 | 360,37 | 217,84 | 265,66 | 145,48 |
01/07/2014 | 362,64 | 217,87 | 266,39 | 146,54 |
01/08/2014 | 365,55 | 228,27 | 274,66 | 149,51 |
01/09/2014 | 380,11 | 229,51 | 280,12 | 152,28 |
01/10/2014 | 375,74 | 229,38 | 278,68 | 153,12 |
01/11/2014 | 352,84 | 218,69 | 264,01 | 149,41 |
01/12/2014 | 366,34 | 218,46 | 268,09 | 149,61 |
01/01/2015 | 361,92 | 217,89 | 266,33 | 151,59 |
01/02/2015 | 306,55 | 204,05 | 239,4 | 143,6 |
01/03/2015 | 299,28 | 197,25 | 232,39 | 140,47 |
01/04/2015 | 295,88 | 191,31 | 227,22 | 139,19 |
01/05/2015 | 281,93 | 189,24 | 221,3 | 136,94 |
01/06/2015 | 260,26 | 175,06 | 204,53 | 131,56 |
01/07/2015 | 252,67 | 173,31 | 200,84 | 130,75 |
01/08/2015 | 230,04 | 163,62 | 186,78 | 126,55 |
01/09/2015 | 231,82 | 162,33 | 186,53 | 124,92 |
01/10/2015 | 211,19 | 158,65 | 177,11 | 123,26 |
01/11/2015 | 199,83 | 154,68 | 170,53 | 120,67 |
01/12/2015 | 194,02 | 151,04 | 166,12 | 118,77 |
01/01/2016 | 168,77 | 137,88 | 148,65 | 112,8 |
01/02/2016 | 155,99 | 129,98 | 138,98 | 108,6 |
01/03/2016 | 157,89 | 128,71 | 138,91 | 108,89 |
01/04/2016 | 152,23 | 128,23 | 136,51 | 106,99 |
01/05/2016 | 122,95 | 118,24 | 119,31 | 102,17 |
01/06/2016 | 123,07 | 118,25 | 119,37 | 101,38 |
01/07/2016 | 123,43 | 116,97 | 118,77 | 100,09 |
01/08/2016 | 119,78 | 110,53 | 113,5 | 97,46 |
01/09/2016 | 120,69 | 109,76 | 113,4 | 97,07 |
01/10/2016 | 118,47 | 106,32 | 110,47 | 96,07 |
01/11/2016 | 114,29 | 105,29 | 108,2 | 94,64 |
01/12/2016 | 115,2 | 106,63 | 109,37 | 96,17 |
01/01/2017 | 114,58 | 105,27 | 108,31 | 95,49 |
01/02/2017 | 122,6 | 109,75 | 114,17 | 98,4 |
01/03/2017 | 119,37 | 107,19 | 111,36 | 96,66 |
01/04/2017 | 122,15 | 107,16 | 112,44 | 96,39 |
01/05/2017 | 132,14 | 110,7 | 118,45 | 98,47 |
01/06/2017 | 136,75 | 115,5 | 123,16 | 101,72 |
01/07/2017 | 134,51 | 115,82 | 122,52 | 102,28 |
01/08/2017 | 134,36 | 116,62 | 122,94 | 102,25 |
01/09/2017 | 133,1 | 116,94 | 122,66 | 102,76 |
01/10/2017 | 138,57 | 114,98 | 123,58 | 102,86 |
01/11/2017 | 139,61 | 113,7 | 123,17 | 102,16 |
01/12/2017 | 136,83 | 113,16 | 121,81 | 102,4 |
01/01/2018 | 137,46 | 114,2 | 122,69 | 102,85 |
01/02/2018 | 138,15 | 112,28 | 121,76 | 102,74 |
01/03/2018 | 145,44 | 115,03 | 126,19 | 104,34 |
01/04/2018 | 141,36 | 114,17 | 124,15 | 105,22 |
01/05/2018 | 143,43 | 116,15 | 126,16 | 106,82 |
01/06/2018 | 135,88 | 115,2 | 122,77 | 106,09 |
01/07/2018 | 127,34 | 109,22 | 115,84 | 102,31 |
01/08/2018 | 132,52 | 110,19 | 118,41 | 103,62 |
01/09/2018 | 127,19 | 108,21 | 115,18 | 101,71 |
01/10/2018 | 124,91 | 109,43 | 115,06 | 102,67 |
01/11/2018 | 140,51 | 108,39 | 120,46 | 104,76 |
01/12/2018 | 122,05 | 105,9 | 112,21 | 102,77 |
01/01/2019 | 121,52 | 108,71 | 113,73 | 103,86 |
01/02/2019 | 119,51 | 107,99 | 112,51 | 104,21 |
01/03/2019 | 117,9 | 106,8 | 111,15 | 103,37 |
01/04/2019 | 120,14 | 106,63 | 111,94 | 103,2 |
01/05/2019 | 118,47 | 106,15 | 110,99 | 103,11 |
01/06/2019 | 120,62 | 104,4 | 110,78 | 102,44 |
01/07/2019 | 115,19 | 106,68 | 110,08 | 102,69 |
01/08/2019 | 112,98 | 106,6 | 109,15 | 103,03 |
01/09/2019 | 113,06 | 104,25 | 107,79 | 103,06 |
01/10/2019 | 112,01 | 103,32 | 106,81 | 102,05 |
01/11/2019 | 101,43 | 101,08 | 101,22 | 100,56 |
01/12/2019 | 100 | 100 | 100 | 100 |
01/01/2020 | 95,17 | 96,91 | 96,18 | 99,03 |
01/02/2020 | 95,22 | 91,26 | 92,95 | 96,41 |
01/03/2020 | 36,95 | 55,25 | 47,79 | 72,21 |
Note : LASSO = moindre contraction absolue et opérateur de sélection. Source : Statistique Canada, calculs des auteurs. |
Tableau de données du graphique 2
Indice d’activité basé sur les composantes principales | Indice simple | Indice pondéré | Index basé sur le LASSO | |
---|---|---|---|---|
niveau de l'indice | ||||
01/01/2002 | 5562,24 | 79,43 | 85,09 | 80,21 |
01/02/2002 | 5224,48 | 82,88 | 87,45 | 78,31 |
01/03/2002 | 4243,91 | 82,37 | 84,54 | 78,13 |
01/04/2002 | 5626,24 | 84,65 | 90,65 | 80,77 |
01/05/2002 | 6239,63 | 81,43 | 89,2 | 82,66 |
01/06/2002 | 5657,11 | 81,77 | 88,28 | 83,57 |
01/07/2002 | 6292,55 | 82,05 | 90,01 | 84,18 |
01/08/2002 | 5814,76 | 82,49 | 89,4 | 83,92 |
01/09/2002 | 6267,22 | 82,16 | 90,14 | 85,7 |
01/10/2002 | 7667,45 | 82,73 | 93,69 | 89,83 |
01/11/2002 | 7413,24 | 82,92 | 93,41 | 91,66 |
01/12/2002 | 6900,72 | 82,58 | 92,12 | 90,72 |
01/01/2003 | 6240,78 | 82,16 | 90,4 | 92,15 |
01/02/2003 | 7319,34 | 81,15 | 91,79 | 93,04 |
01/03/2003 | 8199,98 | 81,5 | 93,79 | 95,4 |
01/04/2003 | 8855,62 | 80,74 | 94,17 | 91,16 |
01/05/2003 | 4712,39 | 81,16 | 87,98 | 88,97 |
01/06/2003 | 4942,04 | 81,57 | 89 | 91,22 |
01/07/2003 | 6042,07 | 81,75 | 92,14 | 92,7 |
01/08/2003 | 5297,57 | 82,13 | 90,8 | 90,71 |
01/09/2003 | 5638,03 | 81,89 | 91,45 | 92,14 |
01/10/2003 | 5705,55 | 82,33 | 92,03 | 89,2 |
01/11/2003 | 6637,96 | 80,51 | 92,55 | 91,53 |
01/12/2003 | 6354,64 | 80,75 | 92,2 | 92,96 |
01/01/2004 | 6377,55 | 83,85 | 95,26 | 94,08 |
01/02/2004 | 5984,01 | 83,32 | 93,86 | 93,11 |
01/03/2004 | 5781,09 | 84,31 | 94,33 | 92,74 |
01/04/2004 | 8976,38 | 83,1 | 101 | 93,32 |
01/05/2004 | 1043,44 | 82,13 | 86,61 | 89,81 |
01/06/2004 | 1157,32 | 84,15 | 89,84 | 92,31 |
01/07/2004 | 919,54 | 83 | 86,03 | 92,46 |
01/08/2004 | 1002,15 | 82,87 | 87,07 | 93,35 |
01/09/2004 | 1046,54 | 82,96 | 87,73 | 93,51 |
01/10/2004 | 956,18 | 83,13 | 86,75 | 91,98 |
01/11/2004 | 1082,97 | 83,53 | 88,83 | 93,92 |
01/12/2004 | 1096,23 | 82,95 | 88,47 | 93,98 |
01/01/2005 | 1116,83 | 82,75 | 88,53 | 93,83 |
01/02/2005 | 1076,08 | 83,74 | 88,95 | 95,46 |
01/03/2005 | 1129 | 82,7 | 88,67 | 94,95 |
01/04/2005 | 1016,3 | 83,22 | 87,82 | 93,02 |
01/05/2005 | 1098,25 | 81,74 | 87,55 | 91,89 |
01/06/2005 | 1176,3 | 82,06 | 88,78 | 92,55 |
01/07/2005 | 1088,7 | 82,72 | 88,39 | 93,77 |
01/08/2005 | 1129,19 | 82,43 | 88,62 | 94,73 |
01/09/2005 | 1369,72 | 82,15 | 91,19 | 97,08 |
01/10/2005 | 1143,89 | 81,95 | 88,75 | 96,92 |
01/11/2005 | 1272,18 | 82,39 | 90,65 | 97,13 |
01/12/2005 | 1155,15 | 82,72 | 89,71 | 96,55 |
01/01/2006 | 1105,85 | 83,92 | 90,24 | 97,59 |
01/02/2006 | 1022,72 | 83,8 | 89,11 | 96,3 |
01/03/2006 | 1259,88 | 82,88 | 91,38 | 98,09 |
01/04/2006 | 1598,84 | 85,67 | 97,68 | 100,91 |
01/05/2006 | 1009,01 | 84,61 | 91,25 | 97,97 |
01/06/2006 | 920,31 | 84,23 | 89,7 | 96,91 |
01/07/2006 | 1062,74 | 84,44 | 91,97 | 99,3 |
01/08/2006 | 1117,95 | 84,42 | 92,67 | 100,63 |
01/09/2006 | 962,48 | 84,22 | 90,55 | 98,02 |
01/10/2006 | 891,39 | 83,85 | 89,21 | 93,66 |
01/11/2006 | 515,95 | 84,98 | 84,6 | 95,24 |
01/12/2006 | 639,62 | 85,12 | 87,75 | 97,2 |
01/01/2007 | 718,78 | 85,51 | 89,72 | 98,18 |
01/02/2007 | 648,56 | 85,72 | 88,6 | 96 |
01/03/2007 | 670,28 | 86,26 | 89,51 | 99,94 |
01/04/2007 | 592,42 | 85,91 | 87,65 | 100,93 |
01/05/2007 | 762,1 | 86,63 | 92,04 | 101,5 |
01/06/2007 | 769,86 | 87,65 | 93,1 | 103,11 |
01/07/2007 | 518,87 | 87,32 | 88,25 | 101,85 |
01/08/2007 | 487,58 | 87,06 | 87,22 | 100,81 |
01/09/2007 | 499,02 | 87,96 | 88,3 | 100,92 |
01/10/2007 | 584,42 | 86,96 | 89,71 | 104,28 |
01/11/2007 | 276,1 | 87,64 | 83,21 | 105,64 |
01/12/2007 | 420,52 | 87,82 | 89,89 | 105,83 |
01/01/2008 | 397,36 | 88,9 | 90,08 | 107,45 |
01/02/2008 | 378,08 | 87,45 | 88,18 | 106,61 |
01/03/2008 | 381,3 | 88,94 | 89,56 | 107,61 |
01/04/2008 | 343,09 | 89,24 | 88,48 | 106,06 |
01/05/2008 | 382,96 | 89,14 | 89,94 | 109 |
01/06/2008 | 484,06 | 90,99 | 95,08 | 109,61 |
01/07/2008 | 552,41 | 91,47 | 97,52 | 111,14 |
01/08/2008 | 564,08 | 90,41 | 96,87 | 110,34 |
01/09/2008 | 496,56 | 91,21 | 95,86 | 108,02 |
01/10/2008 | 401,15 | 91,39 | 93,26 | 105,07 |
01/11/2008 | 395,31 | 89,98 | 91,83 | 106,9 |
01/12/2008 | 317,61 | 88,5 | 87,84 | 102,41 |
01/01/2009 | 315,15 | 87,29 | 86,72 | 100,27 |
01/02/2009 | 375,72 | 90,33 | 91,79 | 100,7 |
01/03/2009 | 309,45 | 89,43 | 88,58 | 98,69 |
01/04/2009 | 381 | 88,94 | 91,24 | 98,34 |
01/05/2009 | 227,61 | 89,52 | 86,23 | 95,2 |
01/06/2009 | 179,03 | 88,21 | 82,4 | 95,84 |
01/07/2009 | 187,74 | 88,7 | 83,39 | 94,13 |
01/08/2009 | 194,6 | 90,51 | 85,29 | 95,36 |
01/09/2009 | 186,3 | 89,79 | 84,18 | 92,3 |
01/10/2009 | 200,51 | 90,83 | 85,97 | 93,41 |
01/11/2009 | 236,33 | 90,01 | 87,61 | 95,4 |
01/12/2009 | 211,69 | 89,78 | 86,05 | 93,21 |
01/01/2010 | 192,67 | 90,29 | 85,3 | 93,07 |
01/02/2010 | 191,56 | 90,71 | 85,57 | 92,63 |
01/03/2010 | 187,44 | 90,41 | 85,05 | 91,48 |
01/04/2010 | 222,62 | 90,44 | 87,47 | 96,67 |
01/05/2010 | 186,31 | 90,45 | 85,34 | 97,23 |
01/06/2010 | 181,82 | 91,75 | 86,07 | 92,9 |
01/07/2010 | 195,99 | 90,85 | 86,36 | 93,1 |
01/08/2010 | 179,67 | 91,77 | 86,03 | 92,81 |
01/09/2010 | 150,84 | 91,84 | 84,01 | 93,32 |
01/10/2010 | 180,48 | 92,38 | 86,9 | 97,67 |
01/11/2010 | 221,21 | 92,94 | 90,29 | 99,72 |
01/12/2010 | 181,91 | 93,74 | 88,55 | 97,65 |
01/01/2011 | 206,77 | 93,54 | 90,21 | 98,85 |
01/02/2011 | 187,98 | 92,59 | 88,2 | 98,28 |
01/03/2011 | 201 | 95,23 | 91,25 | 98,67 |
01/04/2011 | 140,74 | 94,21 | 86,32 | 102,23 |
01/05/2011 | 162,37 | 93,96 | 88,11 | 102,39 |
01/06/2011 | 157,52 | 93,24 | 87,14 | 98,21 |
01/07/2011 | 144,83 | 93,42 | 86,23 | 100,57 |
01/08/2011 | 140,45 | 93,81 | 86,15 | 98,95 |
01/09/2011 | 166,69 | 95,38 | 89,78 | 99,3 |
01/10/2011 | 138,77 | 95,91 | 87,95 | 101,57 |
01/11/2011 | 164,42 | 96,13 | 90,56 | 104,76 |
01/12/2011 | 147,8 | 94,85 | 88,17 | 99,43 |
01/01/2012 | 142,08 | 96,22 | 88,74 | 98,02 |
01/02/2012 | 148,76 | 95,74 | 88,98 | 99,26 |
01/03/2012 | 138,32 | 96,41 | 88,58 | 98,81 |
01/04/2012 | 130,13 | 97,23 | 88,44 | 100,15 |
01/05/2012 | 148,26 | 96,3 | 89,56 | 99,07 |
01/06/2012 | 139,09 | 96,74 | 89,08 | 99,27 |
01/07/2012 | 147,07 | 96,41 | 89,59 | 101,18 |
01/08/2012 | 139,89 | 95,43 | 88,16 | 100,48 |
01/09/2012 | 143,71 | 95,52 | 88,59 | 98,6 |
01/10/2012 | 144,87 | 94,49 | 87,88 | 98,07 |
01/11/2012 | 76,93 | 97,55 | 84,12 | 98,14 |
01/12/2012 | 105,77 | 98,14 | 89,29 | 97,44 |
01/01/2013 | 110,1 | 98,33 | 89,98 | 96,9 |
01/02/2013 | 124,72 | 97,25 | 90,93 | 101,37 |
01/03/2013 | 126,11 | 97,57 | 91,34 | 96,88 |
01/04/2013 | 117,26 | 97,79 | 90,55 | 95,77 |
01/05/2013 | 121,19 | 100,05 | 92,78 | 96,3 |
01/06/2013 | 140,83 | 97,78 | 93,25 | 95,59 |
01/07/2013 | 147,7 | 98,68 | 94,67 | 95,71 |
01/08/2013 | 150,69 | 99,45 | 95,58 | 93,94 |
01/09/2013 | 145,86 | 99,56 | 95,21 | 93,83 |
01/10/2013 | 123,04 | 99,44 | 92,88 | 95,26 |
01/11/2013 | 125,26 | 98,31 | 92,23 | 95,27 |
01/12/2013 | 129,96 | 99,35 | 93,58 | 98,35 |
01/01/2014 | 116,14 | 99,82 | 92,46 | 97,39 |
01/02/2014 | 112,75 | 100,65 | 92,71 | 97,06 |
01/03/2014 | 118,67 | 101,05 | 93,76 | 98,02 |
01/04/2014 | 161 | 98,79 | 96,99 | 96,92 |
01/05/2014 | 105,85 | 100,86 | 93,73 | 96,98 |
01/06/2014 | 107,89 | 100,51 | 93,73 | 96,43 |
01/07/2014 | 114,48 | 102,25 | 95,96 | 96,48 |
01/08/2014 | 100,08 | 100,96 | 93,12 | 93,48 |
01/09/2014 | 98,67 | 98,89 | 91,31 | 92,31 |
01/10/2014 | 110,99 | 99,04 | 93,14 | 91,93 |
01/11/2014 | 120,98 | 99,41 | 94,69 | 91,65 |
01/12/2014 | 100,72 | 98,89 | 91,89 | 92,84 |
01/01/2015 | 86,14 | 98,79 | 89,82 | 90,75 |
01/02/2015 | 95,56 | 99,16 | 91,58 | 91,14 |
01/03/2015 | 106,77 | 98,31 | 92,52 | 90,5 |
01/04/2015 | 78,52 | 99,25 | 89,6 | 89,76 |
01/05/2015 | 94,69 | 99,1 | 92,25 | 92,56 |
01/06/2015 | 109,12 | 100,51 | 95,48 | 91,86 |
01/07/2015 | 109,15 | 98,69 | 94,01 | 91,64 |
01/08/2015 | 97,06 | 101,17 | 94,45 | 88,82 |
01/09/2015 | 80,65 | 100,61 | 91,61 | 90,74 |
01/10/2015 | 94,85 | 99,78 | 93,39 | 90,89 |
01/11/2015 | 94,74 | 98,67 | 92,5 | 93,48 |
01/12/2015 | 77,41 | 99,14 | 90,33 | 87,75 |
01/01/2016 | 78,59 | 98,31 | 89,89 | 85,93 |
01/02/2016 | 73,8 | 98,83 | 89,48 | 84,6 |
01/03/2016 | 62,92 | 98,26 | 87,06 | 82,98 |
01/04/2016 | 70,72 | 99,04 | 89,26 | 83,76 |
01/05/2016 | 84,59 | 98,91 | 91,79 | 84,32 |
01/06/2016 | 85,66 | 99,87 | 92,72 | 87,33 |
01/07/2016 | 76,91 | 97,76 | 89,63 | 82,94 |
01/08/2016 | 80,6 | 98,9 | 91,17 | 82,78 |
01/09/2016 | 96,01 | 98,86 | 93,75 | 85,34 |
01/10/2016 | 96,03 | 100,01 | 94,69 | 83,33 |
01/11/2016 | 101,63 | 100,81 | 96,15 | 85,67 |
01/12/2016 | 85,76 | 99,91 | 93,18 | 87,36 |
01/01/2017 | 104,53 | 100,64 | 96,81 | 89,11 |
01/02/2017 | 117,8 | 99,94 | 98,08 | 89,2 |
01/03/2017 | 99,03 | 99,56 | 95,42 | 87,82 |
01/04/2017 | 107,97 | 98,53 | 95,87 | 85,07 |
01/05/2017 | 87,54 | 98,89 | 93,45 | 84,81 |
01/06/2017 | 67,77 | 99,19 | 90,53 | 81,75 |
01/07/2017 | 67,93 | 98,47 | 90 | 82,18 |
01/08/2017 | 76,06 | 98,5 | 91,64 | 85 |
01/09/2017 | 79,49 | 99,06 | 92,7 | 88,71 |
01/10/2017 | 75,91 | 99,16 | 92,16 | 85,73 |
01/11/2017 | 76,33 | 98,36 | 91,6 | 87,48 |
01/12/2017 | 88,05 | 98,08 | 93,49 | 89,36 |
01/01/2018 | 90,06 | 97,6 | 93,42 | 87,6 |
01/02/2018 | 84,04 | 99,14 | 93,73 | 87,7 |
01/03/2018 | 74,03 | 98,21 | 91,31 | 86,61 |
01/04/2018 | 79,26 | 98,29 | 92,35 | 85,5 |
01/05/2018 | 87,79 | 97,65 | 93,32 | 88,91 |
01/06/2018 | 84,41 | 97,19 | 92,41 | 90,13 |
01/07/2018 | 88,39 | 99,65 | 95,05 | 90,52 |
01/08/2018 | 83,11 | 98,62 | 93,36 | 91,14 |
01/09/2018 | 78,01 | 98,75 | 92,61 | 89,41 |
01/10/2018 | 80,64 | 98,88 | 93,19 | 87,89 |
01/11/2018 | 54,06 | 97,45 | 87,43 | 87,69 |
01/12/2018 | 72,03 | 97,61 | 91,91 | 90,2 |
01/01/2019 | 50,7 | 98,78 | 88,76 | 89 |
01/02/2019 | 57,45 | 98,4 | 90,25 | 89,15 |
01/03/2019 | 68,69 | 99,5 | 93,75 | 91,92 |
01/04/2019 | 73,79 | 99,2 | 94,56 | 92,19 |
01/05/2019 | 66,16 | 98,65 | 92,64 | 92,53 |
01/06/2019 | 72,85 | 97,98 | 93,52 | 92,59 |
01/07/2019 | 75,07 | 98,67 | 94,5 | 94,2 |
01/08/2019 | 82,25 | 97,96 | 95,28 | 94,37 |
01/09/2019 | 81,95 | 97,08 | 94,5 | 94,25 |
01/10/2019 | 83,12 | 99,87 | 97,01 | 95,23 |
01/11/2019 | 95,79 | 99,41 | 98,85 | 96,55 |
01/12/2019 | 100 | 100 | 100 | 100 |
01/01/2020 | 106,7 | 98,56 | 99,78 | 99,31 |
01/02/2020 | 83,86 | 98,9 | 96,87 | 96,97 |
01/03/2020 | 116,72 | 95,31 | 99,58 | 96,15 |
Note : LASSO = moindre contraction absolue et opérateur de sélection. Source : Statistique Canada, calculs des auteurs. |
5 Conclusion
Des mesures de l’activité économique agrégée pour les économies sont essentielles pour éclairer les décisions relatives aux politiques fiscales et financières, déterminer les caractéristiques des cycles économiques et examiner la performance économique. Dans cette étude, quatre indices d’activité économique provinciale et territoriale fondés sur différentes approches méthodologiques sont estimés et présentés. Celles-ci reposent sur un modèle simple; l’ACP; une combinaison pondérée des indices simples et de l’ACP; et le LASSO. Dans la plupart des cas, toutes les approches produisent des résultats à peu près semblables. Toutefois, le caractère cyclique et la variance des fluctuations d’un mois à l’autre peuvent être très différents. En règle générale, l’ACP produit la plus grande variabilité et les cycles les plus prononcés, alors que l’indice simple est le plus stable.
Selon les propriétés des méthodologies et de leurs données de sortie, l’indice simple est le plus uniforme entre les provinces et territoires. Il est aussi le plus facile à interpréter en termes de contributions de variables et de justification de l’inclusion de variable. Cependant, les valeurs des paramètres sont souvent non statistiquement significatives et les séries de données d’entrée sont choisies autant pour leur importance économique que pour leur présence dans toutes les provinces et tous les territoires. Par conséquent, ces modèles offrent une approche plus limitée pour l’examen de l’activité économique agrégée, mais ils constituent également une base pour les comparaisons avec des modèles plus complexes.
Les indices fondés sur l’ACP semblent donner une idée plus complète de l’évolution de l’activité au fil du temps, mais on ne sait pas encore comment les principaux éléments devraient être interprétés. À cause de cela, et parce que les indices de l’ACP présentent la plus grande variabilité, ils présentent un compromis entre l’utilisation globale des séries de données d’entrée et l’intelligibilité.
La pondération de l’indice simple et de l’indice ACP produit un résultat qui a une corrélation supérieure avec les fluctuations annuelles du PIB. La combinaison pondérée continue d’avoir plus de variabilité que l’indice simple. Étant donné que l’ACP est incluse, elle n’est pas aussi facile à interpréter que l’indice simple, mais elle fournit probablement une meilleure mesure de l’activité agrégée que ses composantes.
L’indice LASSO obtient de bons résultats en ce qui concerne le PIB réel annuel, mais la configuration du modèle n’est pas aussi adaptée à la situation rencontrée lors de l’estimation des indices d’activité. En particulier, le nombre relativement faible d’observations limite la capacité des algorithmes à effectuer une validation croisée. De plus, bien que les séries de données d’entrée constituent un sous-ensemble distinct de l’ensemble de données d’entrée et que leurs contributions puissent être générées de façon simple et directe, il n’y a aucune raison théorique pour expliquer pourquoi les variables sont importantes, ce qui limite l’intelligibilité du modèle.
Compte tenu des forces et des faiblesses présentes entre l’adéquation des modèles, leur rendement et l’examen de leurs données de sortie, les évaluations effectuées jusqu’à présent suggèrent que les indices simples ou les indices LASSO présentent des résultats liés à un ensemble de données d’entrée fondamentales (souvent fortement influencées par les séries sur l’emploi), que les indices ACP se rapportent davantage à une forme quelconque d’activité à court terme (mais le signal est bruyant) et que l’indice pondéré présente un compromis entre les deux.
Les indices tels qu’ils sont estimés actuellement sont corrélés aux mesures annuelles du PIB réel et aux mesures sous-annuelles du PIB réel pour l’Ontario et le Québec, mais ils ne doivent pas être interprétés comme une mesure du PIB réel. Les indices présentent une plus grande variabilité et un caractère cyclique plus prononcé que les mesures du PIB réel et sont constitués de mesures de la production brute, de l’emploi, de prix relatifs et de ratios importants, comme le taux de chômage. Cela rend les indices appropriés pour comprendre l’activité économique, mais ils ne sont cependant pas équivalents au PIB réel. De plus, les indices ne donnent pas de renseignements sur les différents niveaux d’activité économique entre les provinces et les territoires.
Les indices sont également basés sur un ensemble de données d’entrée et des stratégies de modélisation qui ne sont pas idéales. De nombreuses hypothèses doivent être imposées pour produire les indices, et n’importe laquelle peut s’avérer être une source d’erreurs de mesure importantes. Par conséquent, les indices présentés ici doivent être considérés comme expérimentaux et peuvent être révisés ou remplacés à mesure que les recherches futures améliorent les processus et/ou testent les hypothèses pour déterminer leur validité.
À l’heure actuelle, les corrélations entre les différentes méthodes, leur corrélation positive avec les mesures du PIB réel infra-annuel produites à l’échelon provincial et les comparaisons des propriétés avec la performance économique provinciale et territoriale connue soutiennent leur utilisation en tant qu’indicateurs de cycles économiques, pour comprendre l’ampleur des chocs par rapport à l’histoire d’une province ou d’un territoire ainsi que l’évolution des économies régionales. Les comparaisons interprovinciales sont également soutenues, mais avec la mise en garde que l’efficacité du modèle est difficile à comprendre dans toutes les situations et que les comparaisons à divers niveaux entre les provinces ne sont pas possibles à partir des valeurs d’indice.
Références
Brave, Scott, et R. Andrew Butters. 2010. « Chicago Fed National Activity Index Turns Ten—Analyzing Its First Decade of Performance. » Chicago Fed Letter, no 273 (avril). Federal Reserve Bank of Chicago. https://www.chicagofed.org/~/media/publications/chicago-fed-letter/2010/cflapril2010-273-pdf.pdf.
Statistique Canada. 2020a. « Produit intérieur brut (PIB) aux prix de base, par industries, mensuel (36 100 434). » Statistique Canada. Statistique Canada, le 24 janvier 2020. https://www150.statcan.gc.ca/n1/pub/13-607-x/2016001/230-fra.htm (consulté le 2 juin 2020)
Statistique Canada. 2020b. « Produit intérieur brut (PIB) aux prix de base, par industries, mensuel (36 100 434). » Statistique Canada. Statistique Canada, le 31 juillet 2019. https://www.statcan.gc.ca/fra/programmes-statistiques/document/1301_D1_V3 (consulté le 2 juin 2020)
Federal Reserve Board of Chicago. 2020. « Chicago Fed National Activity Index (CFNAI) Current Data. » Federal Reserve Board of Chicago, 22 juin 2020. https://www.chicagofed.org/research/data/cfnai/current-data (consulté le 2 juin 2020).
Evans, Liu, Charles L. et Genevieve Pham-Kanter. 2002. « The 2001 Recession and the Chicago Fed National Activity Index: Identifying Business Cycle Turning Points. » Economic Perspectives 26 (3). Federal Reserve Bank of Chicago : p. 26 à 43. https://www.chicagofed.org/~/media/publications/economic-perspectives/2002/3qepart2-pdf.pdf.
Hyndman, R.J., et Athanasopoulos, G. 2018. Forecasting: principles and practice, 2e édition, OTexts : Melbourne, Australie. OTexts.com/fpp2. Consulté le 2 juin 2020.
Jolliffe, I.T. 2002. Principle Components Analysis Second Edition. Springer-Verlag New York Inc., New York, NY.
Nations Unies (ONU), Commission européenne (CE). Fonds monétaire international (FMI), Organisation de coopération et de développement économiques (OCDE) et Banque mondiale (BM). 2009. Système de comptabilité nationale, 2008. New York : Nations Unies. Disponible à : https://unstats.un.org/unsd/nationalaccount/docs/SNA2008FR.pdf (consulté le 2 juin 2020).
Organisation de coopération et de développement économiques (OCDE). 2008. Handbook on Constructing Composite Indicators Methodology and User Guide. Organisation de développement économique. https://www.oecd.org/sdd/42495745.pdf (consulté le 2 juin 2020).
Tibshirani, Robert. 1996. « Regularization Shrinkage and Selection via the Lasso. » Journal of Royal Statistical Society: Series B.
Zou, Hui et Trevor Hastie. 2005. « Regularization and Variable Selection via the Elastic Net. » Journal of Royal Statistical Society: Series B (Statistical Methodology) 67 (2): 301–20. doi:10.1111/j.1467-9868.2005.00503.x.
- Date de modification :