Études analytiques : méthodes et références
Indices expérimentaux de l’activité économique des provinces et territoires au Canada : mesures expérimentales fondées sur des combinaisons de séries chronologiques mensuelles

par Nada Habli, Ryan Macdonald et Jesse Tweedle
Division de l’analyse économique, Statistique Canada No 027

Date de diffusion : le 19 août 2020

Passer au texte

Début du texte

Remerciements

Les auteurs tiennent à remercier Étienne Saint-Pierre, Yvan Clermont, Danny Leung et Brenda Bugge pour leur soutien et leurs conseils tout au long du projet. Ils aimeraient aussi remercier Steve Matthews, Fred Picard et Michel Ferland pour leurs commentaires et leurs contributions sur la modélisation. Ils souhaitent également remercier Philip Smith et Karen Wilson pour leurs conseils, leurs suggestions et leur soutien. 

Résumé

Le présent document porte sur les méthodes de création d’un indicateur mensuel de l’activité économique pour les provinces et les territoires. Il commence par la création d’un ensemble de données pour les provinces et les territoires, composé de séries mensuelles sur : la population active, y compris les salaires et l’emploi; le commerce international; les mesures de production telles que les ventes du secteur de la fabrication ou la production d’électricité; et les prix (consommation, logement et électricité). Lorsque cela est nécessaire, les séries sont désaisonnalisées, couplées et déflatées pour créer des séries chronologiques continues allant de janvier 2002 à avril 2020. Des méthodes de réduction des variables sont ensuite appliquées à l’ensemble de données provincial et territorial mensuel pour créer les indices expérimentaux mensuels de l’activité économique des provinces et territoires. Trois méthodes sont examinées : l’analyse en composantes principales (ACP), la moindre contraction absolue et opérateur de sélection (LASSO) et un indice simple composé de trois séries prédéterminées (emploi total, exportations totales et ventes au détail). Une moyenne pondérée de l’indice simple et de l’indice ACP est également calculée. En général, les indices produits donnent une assez bonne image de l’activité économique provinciale, suivant les mouvements cycliques des économies provinciales et territoriales. Toutefois, la configuration pour les modèles n’est pas idéale, car des données annuelles sont utilisées pour produire les paramètres des modèles, ce qui crée de l’incertitude quant au rendement du modèle. Par conséquent, plusieurs indices sont fournis. Une évaluation de la qualité donne une indication des forces et des limites des indices en ce qui concerne les différentes utilisations.

1 Introduction

Des mesures actuelles de l’activité économique sont essentielles pour comprendre le rendement des économies, et pour orienter les réponses stratégiques aux fluctuations macroéconomiques. Le début de la pandémie attribuable à l’émergence du virus SRAS-CoV-2 a mis l’accent sur ce point, ainsi que sur la nécessité de mesures spécifiques à la région géographique. À l’heure actuelle, le Canada dispose d’un solide système de production de mesures d’activité à jour, comme le produit intérieur brut (PIB) réel, au niveau national. En ce qui concerne les économies provinciales et territoriales, des renseignements mensuels sur les marchés du travail ou sur des activités particulières comme la fabrication ou le commerce international sont disponibles, mais on ne dispose pas d’une mesure mensuelle de l’activité économique agrégée.

Dans des circonstances normales, la production d’un nouvel ensemble d’indicateurs économiques agrégés pour les provinces et les territoires exigerait la création de mesures exploratoires, et demanderait peut-être le lancement de nouvelles enquêtes ou l’expansion des activités de collecte de statistiques existantes, ainsi que la création de l’infrastructure nécessaire à la production et à la diffusion des indicateurs de manière continue. La mise en œuvre de ces modifications nécessite du temps. Dans le contexte actuel, où la pandémie du SRAS-CoV-2 accentue les besoins en indicateurs économiques régionaux mensuels, le temps nécessaire pour mettre sur pied un nouveau programme statistique afin de répondre aux exigences actuelles signifie que cette approche est irréalisable.

Une approche plus rapide consiste à adopter une stratégie fondée sur des modèles statistiques afin de créer rapidement des mesures exploratoires pour l’activité économique provinciale. Bien que cette approche introduise une nouvelle mesure de l’activité économique en temps opportun, le compromis est que les méthodes employées ne sont pas utilisées dans les situations pour lesquelles elles sont idéales, que les entrées pour les modèles utilisent des séries actuellement disponibles sans pouvoir adapter leurs utilisations à la création d’un indicateur, et que les modèles reposent peu sur la théorie. Autrement dit, les modèles recherchent des corrélations dans les données plutôt que d’utiliser la théorie économique pour guider leur construction. Enfin, les modèles employés ici ont généralement un ensemble différent d’intrants pour chaque province ou territoire. Par conséquent, l’uniformité des structures du modèle ne peut être maintenue pour chaque province et territoire, ce qui peut avoir une incidence sur les comparaisons entre les secteurs de compétenceNote .

Pour estimer les indices de l’activité, une stratégie à deux volets est appliquée. En premier lieu, un ensemble de données de panel équilibré composé de séries chronologiques provinciales et territoriales mensuelles est constitué à partir de tableaux de l’Entrepôt commun de données de sortie (ECDS) qui sont accessibles au public. Cet ensemble de données s’étend de janvier 2002 aux plus récents points de données disponibles (actuellement avril 2020). Deuxièmement, trois méthodes sont appliquées à l’ensemble de données pour transformer la série mensuelle en un indicateur de l’activité économique provinciale et territoriale : un modèle simple, l’analyse en composantes principales (ACP) et la moindre contraction absolue et opérateur de sélection (LASSO). Un quatrième indice qui combine l’indice du modèle simple et l’indice basé sur l’ACP est également produit. Les résultats de ces approches forment les mesures exploratoires de l’activité économique provinciale agrégée qui sont présentées ici.

Les indices expérimentaux sont basés sur l’utilisation de modèles statistiques avec un ensemble de données d’entrée qui contient une série d’approximations et d’hypothèses. Parmi les hypothèses pour l’ensemble de données d’entrée, on compte notamment : l’utilisation de déflateurs nationaux pour produire de vraies séries provinciales lorsque les déflateurs provinciaux n’existent pas, l’hypothèse que les taux de croissance pour toutes les séries sont stationnaires en matière de covariance, et l’hypothèse que la winsorisation des données aux 5e et 95e percentiles est appropriée.

Pour les modèles, la croissance annuelle du PIB réel dans l’ensemble des provinces et des territoires sert de mesure de l’activité provinciale agrégée par rapport à laquelle les mesures dérivées de l’indice de l’activité économique sont comparées. Il en résulte une situation où un petit nombre d’observations annuelles sont utilisées pour estimer les paramètres du modèle qui sont utilisés pour déduire les fluctuations mensuelles. Le petit nombre d’observations a une incidence sur la capacité des modèles à fournir des inférences suffisantes, et l’utilisation de données annuelles peut masquer d’importantes différences dans le calendrier mensuel des variations des prix, de la production et de l’emploi.

Afin de permettre la possibilité que l’utilisation des données annuelles puisse avoir une incidence sur le rendement et l’inférence du modèle, le modèle simple suppose qu’un ensemble de variables est approprié et utilise les moindres carrés ordinaires (MCO) pour déterminer leur contribution relative. Dans le cas de l’ACP, on utilise un R carré ajusté et maximisé à partir des régressions par MCO pour choisir lesquels des 10 premiers composants principaux doivent être inclus. Dans ces deux situations, les régressions par MCO incluent des variables qui sont statistiquement non significatives. Pour le LASSO, la signification statistique des variables d’entrée potentielles détermine le modèle final. Toutefois, en ce qui concerne le LASSO, pour certaines économies, aucune variable d’entrée n’est sélectionnée. Dans ces cas, on utilise plutôt la méthode elastic-net ou une stratégie de modélisation générale à spécifique.

Comme l’ensemble de données d’entrée contient un certain nombre d’hypothèses et d’approximations et que les modèles statistiques sont utilisés dans un contexte imparfait, les indices expérimentaux qui sont créés doivent être considérés comme des approximations de l’activité économique agrégée plutôt que comme des mesures exactes. Les indices d’activité ont tendance à présenter une volatilité mensuelle considérable, et lorsqu’on les compare aux estimations du PIB réel produites par le gouvernement du Québec ou le gouvernement de l’Ontario, ils peuvent montrer une plus grande volatilité cyclique.

Dans l’ensemble des mesures, les modèles simples et les modèles LASSO tendent à s’appuyer davantage sur les séries d’emplois comme données d’entrée. L’indice simple a l’avantage d’être facile à comprendre et est le plus comparable pour toutes les provinces et tous les territoires puisqu’il maintient la constante des variables utilisées dans l’indice d’activité, peu importe la province ou le territoire. Les indices de l’ACP semblent saisir davantage de fluctuations liées à d’autres aspects de l’activité globale (p. ex. ventes ou exportations), mais ils présentent aussi une plus grande variabilité. La combinaison pondérée des indices simples définis par les chercheurs et des indices ACP a une meilleure corrélation avec la croissance du PIB réel que les indices constitutifs.

À l’heure actuelle, les indices pondérés ou les indices basés sur le LASSO semblent offrir le meilleur compromis entre les signaux présents dans les données et la variabilité des séries mensuelles. Cette évaluation est fondée sur la mesure dans laquelle les modèles semblent se conformer à la configuration utilisée pour l’estimation ainsi qu’au comportement des indices. Dans certains cas, comme l’indice fondé sur l’ACP pour Terre-Neuve-et-Labrador, il y a une anomalie qui remet en question la véracité de l’indice. Lorsque ce genre de situation se produit, les données sont considérées comme impropres à l’utilisation à l’heure actuelle, et les estimations pour cet indice ne sont pas fournies. Les évaluations sont en cours et peuvent entraîner des changements dans les utilisations ou les indices recommandés, à mesure que l’on étudie la possibilité d’élaborer davantage l’ensemble de données d’entrée, d’affiner les modèles ou d’autres stratégies de modèles.

Le reste du présent document est structuré comme suit. La section 2 traite de la création de l’ensemble de données d’entrée ainsi que des hypothèses utilisées pour filtrer et transformer les données avant la modélisation. La section 3 décrit les modèles employés, les hypothèses intégrées aux modèles, ainsi que leurs forces, leurs limites et leur application pour créer des indices mensuels. La section 4 présente une analyse du rendement du modèle et illustre les indices qui en résultent. La section 5 présente la conclusion.

2 Ensemble de données d’entrée

L’ensemble de données d’entrée est composé de mesures propres à une province ou à un territoire pour l’activité économique et les déflateurs économiques au niveau du Canada, sauf dans les cas où des déflateurs propres à une province ou à un territoire sont disponibles. Les séries mensuelles de données d’entrée sont composées d’enquêtes mensuelles sur la main-d’œuvre, les produits et les prix (tableau 1). Dans certains cas, les tableaux actifs ne contiennent pas de renseignements continus allant de janvier 2002 à ce jour. Dans ce cas, les tableaux historiques sont utilisés pour rétropoler les tableaux actifs.


Tableau 1
Tableaux des données d’entrée des séries chronologiques provinciales et territoriales
Sommaire du tableau
Le tableau montre les résultats de Tableaux des données d’entrée des séries chronologiques provinciales et territoriales. Les données sont présentées selon Numéro de tableau (titres de rangée) et Titre du tableau(figurant comme en-tête de colonne).
Numéro de tableau Titre du tableau
12100099 Importations et exportations de marchandises, base douanière, selon le Système harmonisé de désignation et de codification des marchandises (SH), Canada, provinces et territoires, États-Unis, États
12100119 Commerce international de marchandises par province, produit et principaux partenaires commerciaux
14100036 Heures effectivement travaillées selon l’industrie, données mensuelles non désaisonnalisées
14100201 Emploi selon l’industrie, données mensuelles non désaisonnalisées
14100222 Emploi, rémunération horaire et hebdomadaire moyenne (incluant les heures supplémentaires) et heures hebdomadaires moyennes pour l’ensemble des industries excluant les entreprises non classifiées, données mensuelles désaisonnalisées
14100287 Caractéristiques de la population active, données mensuelles désaisonnalisées et tendance-cycle, cinq derniers mois
14100292 Caractéristiques de la population active selon le territoire, moyennes mobiles de trois mois, données désaisonnalisées et non désaisonnalisées, 5 derniers mois
14100355 Emploi selon l’industrie, données mensuelles désaisonnalisées et non désaisonnalisées, et tendance-cycle, cinq derniers mois
16100048 Ventes pour les industries manufacturières selon l’industrie et province, données mensuelles (dollars sauf indication contraire)
18100004 Indice des prix à la consommation mensuel, non désaisonnalisé
18100204 Indice des prix de vente de l’énergie électrique, mensuel
18100205 Indice des prix des logements neufs, mensuel
20100008 Ventes de commerce de détail par province et territoire
20100074 Commerce de gros, ventes
21100019 Enquête mensuelle sur les services de restauration et les débits de boissons
24100002 Nombre de véhicules voyageant entre le Canada et les États-Unis
25100001 Statistiques de l’énergie électrique, avec des données pour les années 1950 à 2007
25100015 Production de l’énergie électrique, production mensuelle selon le type d’électricité
34100003 Permis de bâtir, valeur selon le secteur d’activité
34100066 Permis de bâtir, par type de structure et type de travaux
34100158 Société canadienne d’hypothèques et de logement, logements mis en chantier, toutes les régions, pour Canada et les provinces, désaisonnalisées au taux annuel, mensuel

Les déflateurs sont principalement recueillis dans le cadre de programmes d’enquête au niveau du Canada pour les mesures de l’activité économique (tableau 2). À l’heure actuelle, Statistique Canada ne produit pas de déflateurs propres aux provinces et aux territoires pour les mesures en dollars courants du commerce international, des ventes du secteur de la fabrication, des ventes en gros, des ventes au détail ou de l’Enquête mensuelle sur les services de restauration. Pour recueillir les déflateurs, les indices de prix au niveau du Canada sont tirés d’enquêtes lorsqu’ils sont disponibles. Dans le cas de la fabrication, l’indice implicite de prix est calculé en tant que ratio entre la valeur nominale et la valeur réelle. Il existe des déflateurs pour les séries nominales depuis janvier 2002, sauf pour la fabrication. Pour la fabrication, l’Indice des prix des produits industriels (IPPI) par industrie, l’IPPI par groupe de produits et le ratio entre le PIB nominal et le PIB mensuel réel sont utilisés comme base de projection pour les déflateurs de l’industrie manufacturière.


Tableau 2
Tableaux de données pour les séries chronologiques des déflateurs
Sommaire du tableau
Le tableau montre les résultats de Tableaux de données pour les séries chronologiques des déflateurs. Les données sont présentées selon Numéro de tableau (titres de rangée) et Titre du tableau(figurant comme en-tête de colonne).
Numéro de tableau Titre du tableau
12100128 Commerce international de marchandises par classification des produits, indices de prix et de volume, mensuel
16100013 Valeur réelle des ventes, des commandes, des stocks possédés et le ratio des stocks aux ventes des industries manufacturières, en dollars de 2012, désaisonnalisées
16100047 Stocks, ventes, commandes et rapport des stocks sur les ventes pour les industries manufacturières, selon l’industrie (dollars sauf indication contraire)
18100004 Indice des prix à la consommation mensuel, non désaisonnalisé
18100029 Indice des prix des produits industriels, par principaux groupes de produits, mensuel
18100032 Indice des prix des produits industriels, par industrie, mensuel
20100003 Ventes de grossistes, prix et volume, selon l’industrie, désaisonnalisées
20100038 Commerce de détail, ventes, dollars enchaînés et indices de prix, inactif
20100051 Commerce de gros, ventes, dollars enchaînés et indices de prix, inactif
20100078 Ventes au détail, prix et volume, désaisonnalisé
36100434 Produit intérieur brut (PIB) aux prix de base, par industriel, mensuel

Pour combiner les données provinciales et les données des déflateurs afin de créer l’ensemble de données d’entrée, il y a quatre étapes :

  1. Assembler les données. Les tableaux de l’ECDS sont filtrés pour sélectionner les données désirées. Seules les variables avec des données continues sont sélectionnées. Les séries pouvant faire l’objet de suppression sont exclues, mais les séries comportant des valeurs nulles sont incluses. Les séries pouvant faire l’objet de suppression sont généralement des séries aux valeurs plus petites, ce qui signifie qu’elles contiennent moins de renseignements sur les fluctuations économiques agrégées. Bien qu’il existe des méthodes pour interpoler ces points de données, si la suppression se produit au cours du dernier mois, une prévision serait nécessaire pour remplir le point de données supprimé. Étant donné que l’indice est en cours de construction pour fournir des renseignements sur le plus grand choc ayant frappé l’économie canadienne depuis la Seconde Guerre mondiale, on juge qu’il n’est pas souhaitable d’inclure des séries comportant des valeurs prévues.
  2. Désaisonnaliser les séries de données. Ce ne sont pas toutes les séries qui sont fournies sur une base désaisonnalisée. Il y a au total 966 séries qui sont désaisonnalisées pour être utilisées dans l’indicateur. Étant donné le nombre élevé de séries, les options automatiques de l’algorithme ARIMA-SEATS du progiciel R relatif à la saisonnalité sont utilisées pour supprimer la saisonnalité. Les paramètres saisonniers sont déterminés en fonction des séries chronologiques mensuelles disponibles jusqu’en décembre 2019. Dans le cas où les séries chronologiques ne couvrent pas toute la période, comme les séries interrompues, les données jusqu’à la période la plus récente sont utilisées pour déterminer les options de désaisonnalisation.
  1. Coupler les données. Après la désaisonnalisation, les données sont couplées au besoin. Lorsqu’il existe des périodes de chevauchement, des liens sont établis en traitant les données comme des indices et en les enchaînant rétrospectivement sur les périodes historiques. S’il n’existe pas de périodes de chevauchement, les valeurs de niveau sont jointes « telles quelles ».
  2. Appliquer les déflateurs. Si nécessaire, des déflateurs sont appliqués aux séries en dollars courants ou aux séries de prix pour produire des variables relatives des prix.

L’ensemble de données complet avant le filtrage contient des séries désaisonnalisées et non désaisonnalisées, des séries nominales et des séries déflatées propres à la province et au territoire. Pour modéliser l’activité économique provinciale et territoriale, des séries en unités naturelles (p. ex. employés, heures travaillées), des séries déflatées, des taux (p. ex. le taux de chômage) et les prix relatifs sont sélectionnés.

3 Estimation

L’objectif est d’estimer les séries chronologiques mensuelles pour l’activité économique agrégée dans les provinces et les territoires en tant que fonction des séries chronologiques économiques mensuelles provinciales et territoriales disponibles :

y m e n s u e l , t = f ( m e n s u e l / p é r i o d e / s é r i e ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWG5bWdamaaBaaaleaapeGaamyBaiaad+gacaWGUbGaamiDaiaa dIgacaWGSbGaamyEaiaacYcacaWG0baapaqabaGcpeGaeyypa0Jaam Ozamaabmaapaqaa8qacaWGTbGaam4Baiaad6gacaWG0bGaamiAaiaa dYgacaWG5bGaai4laiaadshacaWGPbGaamyBaiaadwgacaGGVaGaam 4CaiaadwgacaWGYbGaamyAaiaadwgacaWGZbaacaGLOaGaayzkaaaa aa@54F9@

La mesure la plus couramment citée de l’activité économique agrégée est la mesure du PIB réel décrite dans le Système de comptabilité nationale de 2008 (Nations Unies, 2010)Note . Au niveau de l’ensemble du Canada, la fonction pour la transformation des séries de données d’entrée en PIB réel mensuel est fondée sur des méthodologies et des points de repère propres à l’industrie qui ont été élaborés et enrichis au fil du temps. Les méthodologies utilisent diverses sources de données pour estimer les variations de la production brute qui servent d’approximation pour le PIB réel. Les approximations sont combinées à des points de repère annuels du PIB réel pour produire la série mensuelle du PIB réel. Dans de nombreux cas, une mesure directe de la production brute est disponible. Toutefois, dans certaines industries, aucune mesure directe de la production n’est disponible et les estimations sont produites au moyen d’autres sources de données, comme l’emploi (Statistique Canada, 2020b)Note . Cette méthodologie forme la fonction f ( . ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWGMbWaaeWaa8aabaWdbiaac6caaiaawIcacaGLPaaaaaa@395C@ dans laquelle les séries mensuelles sont placées pour produire le PIB réel mensuel du Canada.

La difficulté en ce qui concerne mesurer l’activité économique agrégée des provinces et des territoires est le fait que la fonction f ( . ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWGMbWaaeWaa8aabaWdbiaac6caaiaawIcacaGLPaaaaaa@395C@ pour les provinces et les territoires est inconnue et que la série désirée, y m e n s u e l , t MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWG5bWdamaaBaaaleaapeGaamyBaiaad+gacaWGUbGaamiDaiaa dIgacaWGSbGaamyEaiaacYcacaWG0baapaqabaaaaa@3FC6@ est également inconnue.

Puisque le but est d’estimer y m e n s u e l , t MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWG5bWdamaaBaaaleaapeGaamyBaiaad+gacaWGUbGaamiDaiaa dIgacaWGSbGaamyEaiaacYcacaWG0baapaqabaaaaa@3FC6@ , si un proche substitut existait, il pourrait servir d’instrument pour le vrai y m e n s u e l , t MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWG5bWdamaaBaaaleaapeGaamyBaiaad+gacaWGUbGaamiDaiaa dIgacaWGSbGaamyEaiaacYcacaWG0baapaqabaaaaa@3FC6@ . La fonction f ( . ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWGMbWaaeWaa8aabaWdbiaac6caaiaawIcacaGLPaaaaaa@395C@ pour combiner des renseignements mensuels afin de produire une mesure agrégée de l’activité économique pourrait alors être approximative. Bien qu’il n’existe aucun substitut mensuel proche pour y m e n s u e l , t MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWG5bWdamaaBaaaleaapeGaamyBaiaad+gacaWGUbGaamiDaiaa dIgacaWGSbGaamyEaiaacYcacaWG0baapaqabaaaaa@3FC6@ , le Système canadien des comptes macroéconomiques produit une mesure du PIB provincial et territorial à une fréquence annuelle. L’approche adoptée ici suppose donc que les données annuelles peuvent servir d’instrument pour aider à éclairer la structure de f ( . ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWGMbWaaeWaa8aabaWdbiaac6caaiaawIcacaGLPaaaaaa@395C@ lorsque la moyenne des taux de croissance mensuels de la série d’entrées disponibles est calculée pour une année civile et utilisée pour estimer les valeurs des paramètres. Les paramètres de f ( . ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWGMbWaaeWaa8aabaWdbiaac6caaiaawIcacaGLPaaaaaa@395C@ et les caractéristiques de variance de la série d’entrées mensuelles sont ensuite ajustées pour tenir compte de la différence de périodicité. Les indices mensuels de l’activité économique agrégée sont alors élaborés à partir des valeurs mensuelles estimées de y m e n s u e l , t MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWG5bWdamaaBaaaleaapeGaamyBaiaad+gacaWGUbGaamiDaiaa dIgacaWGSbGaamyEaiaacYcacaWG0baapaqabaaaaa@3FC6@ .

L’utilisation d’une variable de fréquence plus basse comme instrument pour l’activité économique mensuelle réduit le nombre de degrés de liberté et introduit des problèmes liés au rythme des fluctuations mensuelles par rapport aux fluctuations annuelles. Ces problèmes auront des conséquences sur la capacité des modèles à produire une estimation mensuelle de l’activité économique agrégée. Les petits degrés de liberté et la covariance autour de la récession de 2008 auront tendance à produire des paramètres non statistiquement significatifs pour f ( . ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWGMbWaaeWaa8aabaWdbiaac6caaiaawIcacaGLPaaaaaa@395C@ , si les variables explicatives ne sont pas touchées de façon importante par les fluctuations du cycle économique. En outre, les modèles peuvent avoir tendance à sélectionner un nombre plus faible d’entrées à une fréquence annuelle qu’il n’est nécessaire pour expliquer la variation mensuelle, car d’importantes fluctuations mensuelles peuvent être masquées par une agrégation à une fréquence plus faible. De plus, les changements liés aux prix, aux ventes/à la production et à l’emploi se produiront simultanément à une fréquence annuelle. Toutefois, à une fréquence mensuelle, ces fluctuations peuvent ne pas s’aligner.

Étant donné qu’une conversion de la fréquence annuelle à une fréquence mensuelle est nécessaire pour générer les valeurs estimées désirées, la stratégie de modélisation comprend certaines approches qui préfèrent capturer davantage de variation dans les données plutôt que de se concentrer uniquement sur la parcimonie des modèles. Cela ne veut pas dire que les modèles sont produits de manière ponctuelle. Au contraire, les critères de sélection, comme la maximisation d’un R carré ajusté, sont utilisés en parallèle avec des stratégies de modélisation de type général ou spécifique plus traditionnelles.

En résumé, parce que la forme fonctionnelle pour la transformation des données mensuelles en mesures agrégées de l’activité économique est inconnue, et parce que les valeurs réelles de la série y m e n s u e l , t MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWG5bWdamaaBaaaleaapeGaamyBaiaad+gacaWGUbGaamiDaiaa dIgacaWGSbGaamyEaiaacYcacaWG0baapaqabaaaaa@3FC6@  sont également inconnues, la meilleure chose possible est d’approcher le vrai y m e n s u e l , t MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWG5bWdamaaBaaaleaapeGaamyBaiaad+gacaWGUbGaamiDaiaa dIgacaWGSbGaamyEaiaacYcacaWG0baapaqabaaaaa@3FC6@ . Cela signifie que la série y ^ m e n s u e l , t MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qaceWG5bWdayaajaWaaSbaaSqaa8qacaWGTbGaam4Baiaad6gacaWG 0bGaamiAaiaadYgacaWG5bGaaiilaiaadshaa8aabeaaaaa@3FD6@  ressemblera fortement à une série sur le PIB réel, mais ne sera pas une véritable mesure du PIB mensuel réel. Elle sera plutôt une estimation de l’indice d’activité économique qui correspond aux conditions macroéconomiques dans les provinces et les territoires.

3.1 Stratégie d’estimation

La fonction f ( . ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWGMbWaaeWaa8aabaWdbiaac6caaiaawIcacaGLPaaaaaa@395C@ est un ensemble d’instructions pour transformer un grand nombre de données d’entrée en une seule série. Dans cet article, on suppose que la fonction peut être basée de façon approximative sur une combinaison linéaire d’entrées et que les entrées peuvent être sélectionnées soit en sélectionnant un sous-ensemble des données disponibles, soit en créant une combinaison de toutes les séries de données d’entrée. Ci-dessous, trois approches sont explorées : 1) un modèle simple; 2) l’ACP; et 3) le LASSO. Le modèle simple et le modèle LASSO relèvent de la première catégorie, tandis que l’ACP appartient à la deuxième catégorie.

Les hypothèses et la mise en œuvre des modèles sont examinées en détail ci-après. Dans toutes les stratégies de modélisation, les étapes suivantes sont suivies pour estimer les valeurs des indices dans tous les cas :

L’ensemble de données d’entrée comporte 1 341 séries qui sont distribuées inégalement à travers les provinces et les territoires (tableau 3). Toutes les séries n’ont pas la même utilité pour modéliser l’activité économique agrégée. Dans les cas où la désaisonnalisation a échoué, les séries sont supprimées. De même, les séries comportant des valeurs nulles sont supprimées. Ces séries ont tendance à être des séries où les valeurs nulles sont entrecoupées par des valeurs nominales. Dans ces cas, les valeurs désaisonnalisées peuvent être négatives, le taux de croissance ou les transformations des différences logarithmiques peuvent ne pas fonctionner, et les séries ont une valeur douteuse en ce qui concerne leur utilité comme indicateur permanent de l’activité économique. Dans l’ensemble, 198 variables sont abandonnées pour ces raisons.


Tableau 3
Nombre de variables d’entrée
Sommaire du tableau
Le tableau montre les résultats de Nombre de variables d’entrée. Les données sont présentées selon (titres de rangée) et Vecteurs de départ, Avec 0, Échec de la DS, Non renouvelé, 15 principaux vecteurs, 25 principaux vecteurs, Vecteurs pour le LASSO et Vecteurs pour l’ACP(figurant comme en-tête de colonne).
Vecteurs de départ Avec 0 Échec de la DS Non renouvelé 15 principaux vecteurs 25 principaux vecteurs Vecteurs pour le LASSO Vecteurs pour l’ACP
Terre-Neuve-et-Labrador 108 3 8 8 15 25 83 73
Île-du-Prince-Édouard 101 12 15 20 12 20 65 57
Nouvelle-Écosse 115 2 14 14 15 25 84 74
Nouveau-Brunswick 115 1 12 13 15 24 81 72
Québec 131 1 10 11 18 29 97 86
Ontario 133 0 11 11 18 30 99 87
Manitoba 120 1 6 6 17 28 94 83
Saskatchewan 118 0 11 11 16 26 85 75
Alberta 122 0 8 8 17 27 91 81
Colombie-Britannique 122 0 8 8 17 28 92 81
Yukon 63 22 20 26 6 10 31 27
Territoires du Nord-Ouest 59 27 29 31 5 7 23 21
Nunavut 46 29 29 32 2 4 11 9
Total 1 353 98 181 199 173 283 936 826

L’ensemble de données d’entrée filtré contient alors 1 143 séries. Cependant, les séries sont généralement rapportées en niveaux (p. ex. heures travaillées ou ventes manufacturières en dollars enchaînés) et présentent de fortes tendances au cours de la période d’échantillonnage. Pour tenir compte des tendances, les séries sont transformées en taux de croissance d’un mois à l’autre. Ces taux de croissance seront finalement comparés aux mesures de la croissance du PIB réel, et ils ont l’avantage d’être liés par -100 % pour le déclin maximumNote . Les taux de croissance pour la série sont censés être stationnaires en matière de covariance.

Pour utiliser la série dans l’estimation, toutes les séries sont centrées et mises à l’échelle pour avoir une variance au niveau des unités à une fréquence mensuelle. Ce processus de normalisation est appliqué aux variables afin d’éviter que des variables dont les valeurs unitaires sont naturellement plus élevées n’affectent les résultats. Étant donné que les séries chronologiques mensuelles peuvent avoir une forte variabilité, et parce que les périodes de chocs économiques comme les récessions peuvent produire des points de données aberrants, toutes les séries sont « winsorisées » (ou tronquées des valeurs extrêmes supérieures et inférieures) avant l’estimation. Cela empêche les points de données extrêmes d’affecter les résultats. Pour créer les indices mensuels, les valeurs des paramètres provenant des modèles basés sur les données obtenues par winsorisation sont combinées avec des données non-winsorisées, ce qui permet aux valeurs plus importantes d’avoir toute leur influence lorsque de grands chocs surviennent.

Enfin, les séries les plus bruyantes sont supprimées. Dans le cas de l’ACP, la tranche supérieure de 25 % des séries selon la variance est éliminée par province, tandis que pour le LASSO, la tranche supérieure de 15 % des séries selon la variance est éliminée. Ces seuils sont arbitraires, mais leur imposition a permis d’améliorer la capacité des modèles d’éclairer sur l’activité agrégée (c.-à-d. améliorer le signal par rapport au bruit) et d’améliorer la cohérence des résultats entre les méthodes. Après ajustement pour les séries à variation élevée, il y a un total de 928 variables d’entrée pour le LASSO et 820 pour l’ACP. Le Nunavut possède le plus petit nombre de séries disponibles, tandis que l’Ontario et le Québec en comptent le plus grand nombre.

Cette estimation est fondée sur la combinaison de la croissance du PIB réel et des moyennes annuelles des séries mensuelles de données d’entrée pour les années 2002 à 2018. La croissance réelle du PIB n’est ni mise à l’échelle ni centrée. En utilisant la croissance réelle du PIB comme variable cible et les moyennes annuelles des séries mensuelles comme variables d’entrée, la forme fonctionnelle de f ( . ) MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWGMbWaaeWaa8aabaWdbiaac6caaiaawIcacaGLPaaaaaa@395C@ est estimée. Dans tous les modèles employés, on suppose qu’une combinaison linéaire de variables d’entrée peut être utilisée pour transformer la multiplicité des variables d’entrée en une mesure unique de l’activité agrégée. Dans le cas du modèle simple et du LASSO, un sous-ensemble des variables est utilisé directement. Dans le cas de l’ACP, les 10 premières composantes principales sont utilisées comme point de départ. On présume aussi que les MCO peuvent être utilisés pour générer des contributions permettant de combiner des variables d’entrée. En utilisant des méthodes de régression pour combiner les données d’entrée, on impose une hypothèse supplémentaire comme quoi les structures économiques sont, en moyenne, les mêmes pendant toute la période d’échantillonnage.

Étant donné que toutes les approches peuvent être considérées comme une régression des MCO avec des données d’entrée centrées, l’interception peut être interprétée comme le taux de croissance annuel moyen du PIB réel entre 2002 et 2018. Les données d’entrée sélectionnées (séries chronologiques mensuelles ou composantes principales) produisent des fluctuations pour ce taux de croissance moyen. Pour 2019 et 2020, on suppose que le taux de croissance moyen entre 2002 et 2018 est représentatif de la croissance sous-jacente.

Pour produire des estimations mensuelles, il est nécessaire d’ajuster les estimations des paramètres ou les séries mensuelles pour tenir compte de la différence à l’égard de la périodicité. La constante du modèle est ajustée à une fréquence mensuelle basée sur le taux de croissance mensuel composé qui est équivalent à l’estimation annuelle :

β ^ 0 , m e n s u e l = ( β ^ 0 , a n n u e l + 1 ) 1 / 12 1 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacuaHYoGypaGbaKaadaWgaaWcbaWdbiaaicdacaGGSaGaamyBaiaa d+gacaWGUbGaamiDaiaadIgacaWGSbGaamyEaaWdaeqaaOWdbiabg2 da9iaacIcacuaHYoGypaGbaKaadaWgaaWcbaWdbiaaicdacaGGSaGa amyyaiaad6gacaWGUbGaamyDaiaadggacaWGSbaapaqabaGcpeGaey 4kaSIaaGymaiaacMcapaWaaWbaaSqabeaapeGaaGymaiaac+cacaaI XaGaaGOmaaaakiabgkHiTiaaigdaaaa@525F@

Pour estimer les fluctuations mensuelles autour du taux de croissance tendanciel, les séries de données d’entrées brutes sont utilisées. Cela permet aux fluctuations importantes dans la série chronologique de présenter toutes leurs répercussions lorsque les chocs économiques, comme les récessions ou les cycles de prix des produits de base, ont des répercussions sur les économies provinciales et territoriales. Les variations des données d’entrée mensuelles sont ajustées pour correspondre à l’écart annuel avant utilisation. Les estimations de régression des MCO sont basées sur le ratio cov(x,y)/var(x). Dans le contexte actuel, l’agrégation au fil du temps réduit la variance de la matrice X. Pour tenir compte de cela, la variance des données mensuelles est rééchelonnée de façon à correspondre à la variance des données annuelles pour chaque série avec l’équation suivante :

σ m e n s u e l , a j u s t é = ( ( x μ x ) σ x , m e n s u e l ) * σ x , a n n u e l + μ x MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacqaHdpWCpaWaaSbaaSqaa8qacaWGTbGaam4Baiaad6gacaWG0bGa amiAaiaadYgacaWG5bGaaiilaiaadggacaWGKbGaamOAaiaadwhaca WGZbGaamiDaiaadwgacaWGKbaapaqabaGcpeGaeyypa0ZaaeWaa8aa baWdbmaalaaapaqaa8qadaqadaWdaeaapeGaamiEaiabgkHiTiabeY 7aT9aadaWgaaWcbaWdbiaadIhaa8aabeaaaOWdbiaawIcacaGLPaaa a8aabaWdbiabeo8aZ9aadaWgaaWcbaWdbiaadIhacaGGSaGaamyBai aad+gacaWGUbGaamiDaiaadIgacaWGSbGaamyEaaWdaeqaaaaaaOWd biaawIcacaGLPaaacaGGQaGaeq4Wdm3damaaBaaaleaapeGaamiEai aacYcacaWGHbGaamOBaiaad6gacaWG1bGaamyyaiaadYgaa8aabeaa k8qacqGHRaWkcqaH8oqBpaWaaSbaaSqaa8qacaWG4baapaqabaaaaa@698D@

Les valeurs ajustées provenant des modèles sont des estimations de la croissance mensuelle de l’activité économique. Elles peuvent être transformées en indices en ajoutant 1 pour créer une valeur de liaison pour un indice en chaîne. Le niveau de l’indice est ensuite calculé en enchaînant les valeurs à partir de janvier 2002.

Les estimations du taux de croissance sont associées à un intervalle de confiance, car il existe une incertitude quantifiable qui découle du modèle. Il existe également une incertitude non quantifiable qui découle d’une possible erreur de spécification du modèle. Pour produire un indice de niveau, il est nécessaire de supposer que les estimations du taux de croissance sont suffisamment précises pour pouvoir être utilisées pour l’enchaînement, même si les erreurs sont aggravées au fil du temps. Il s’agit là d’une hypothèse solide, mais elle est compatible avec la façon dont les valeurs moyennes des données d’enquête sur les prix, les valeurs et les quantités sont combinées pour produire des indices de quantité enchaînée ou de prix enchaînés.

L’utilisation de plusieurs modèles à l’étape 3 conduira finalement à la présentation de différents types de l’indice d’activité. Dans le contexte actuel, où les modèles statistiques sont utilisés pour donner des renseignements sur l’activité économique dans un environnement où ils ne peuvent être mis en œuvre de manière optimale, la création de plusieurs versions de l’indice de l’activité joue un rôle important. Parce que la vraie valeur pour y m e n s u e l , t MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWG5bWdamaaBaaaleaapeGaamyBaiaad+gacaWGUbGaamiDaiaa dIgacaWGSbGaamyEaiaacYcacaWG0baapaqabaaaaa@3FC6@ inconnue, valider f ( . ) ^ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaWaaecaaeaaqa aaaaaaaaWdbiaadAgadaqadaWdaeaapeGaaiOlaaGaayjkaiaawMca aaWdaiaawkWaaaaa@3A2D@ et y ^ m e n s u e l , t MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qaceWG5bWdayaajaWaaSbaaSqaa8qacaWGTbGaam4Baiaad6gacaWG 0bGaamiAaiaadYgacaWG5bGaaiilaiaadshaa8aabeaaaaa@3FD6@ est difficile. Les données de sortie des différentes méthodes fournissent une forme naturelle de confrontation des données qui aide à évaluer l’acceptabilité et la généralisation des estimations.

3.1.1 Modèle simple

Le modèle simple part du principe que l’emploi total, les exportations totales et les ventes totales au détail contiennent les renseignements appropriés pour comprendre les fluctuations économiques agrégées. Cette hypothèse est probablement trop hardie, car plus de trois données d’entrée sont nécessaires pour saisir pleinement les complexités de l’activité économique agrégée. Toutefois, le modèle est cohérent dans l’ensemble des provinces et des territoires, et il est facile de le comprendre. Il est donc utile en tant que base contre laquelle des méthodes plus complexes peuvent être évaluées. L’approche simple représente également une méthode qui peut être considérée comme compatible avec les types de bases de projection utilisées pour déduire les mouvements de la production brute qui sont utilisés comme données d’entrée pour le PIB mensuel du Canada (Statistique Canada, 2020b).

Comme les séries n’ont pas de structure naturelle d’agrégation pour les combiner, les régressions sont utilisées pour déterminer les contributions relatives des variables plutôt qu’une formule de calcul de l’indice. Étant donné que les données d’entrée sont censées être les données d’entrée nécessaires, les trois séries sont incluses indépendamment de leur importance statistique en matière de régressions.

3.1.2 Analyse des composantes principales

L’ACP est une technique de réduction variable qui vise à expliquer la variance d’un ensemble de données particulier en utilisant un plus petit nombre de composantes principales (OCDE 2008, Jollife 2002). Un ensemble de données avec des variables p X = [ x 1 , x 1 , ... , x p ] MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWGybGaeyypa0ZaamWaa8aabaWdbiaadIhapaWaaSbaaSqaa8qa caaIXaaapaqabaGcpeGaaiilaiaadIhapaWaaSbaaSqaa8qacaaIXa aapaqabaGcpeGaaiilaiaac6cacaGGUaGaaiOlaiaacYcacaWG4bWd amaaBaaaleaapeGaamiCaaWdaeqaaaGcpeGaay5waiaaw2faaaaa@44EF@ , peut être transformé pour produire les composantes principales p :

Z = A X MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWGAbGaeyypa0JaamyqaiaadIfaaaa@399F@

z 1 = a 1 , 1 x 1 + a 1 , 2 x 2 + .. + a 1 , p x p MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWG6bWdamaaBaaaleaapeGaaGymaaWdaeqaaOWdbiabg2da9iaa dggapaWaaSbaaSqaa8qacaaIXaGaaiilaiaaigdaa8aabeaak8qaca WG4bWdamaaBaaaleaapeGaaGymaaWdaeqaaOWdbiabgUcaRiaadgga paWaaSbaaSqaa8qacaaIXaGaaiilaiaaikdaa8aabeaak8qacaWG4b WdamaaBaaaleaapeGaaGOmaaWdaeqaaOWdbiabgUcaRiaac6cacaGG UaGaey4kaSIaamyya8aadaWgaaWcbaWdbiaaigdacaGGSaGaamiCaa WdaeqaaOWdbiaadIhapaWaaSbaaSqaa8qacaWGWbaapaqabaaaaa@4EB5@ z 2 = a 2 , 1 x 1 + a 2 , 2 x 2 + .. + a 2 , p x p MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWG6bWdamaaBaaaleaapeGaaGOmaaWdaeqaaOWdbiabg2da9iaa dggapaWaaSbaaSqaa8qacaaIYaGaaiilaiaaigdaa8aabeaak8qaca WG4bWdamaaBaaaleaapeGaaGymaaWdaeqaaOWdbiabgUcaRiaadgga paWaaSbaaSqaa8qacaaIYaGaaiilaiaaikdaa8aabeaak8qacaWG4b WdamaaBaaaleaapeGaaGOmaaWdaeqaaOWdbiabgUcaRiaac6cacaGG UaGaey4kaSIaamyya8aadaWgaaWcbaWdbiaaikdacaGGSaGaamiCaa WdaeqaaOWdbiaadIhapaWaaSbaaSqaa8qacaWGWbaapaqabaaaaa@4EB9@ z p = a p , 1 x 1 + a p , 2 x 2 + .. + a p , p x p MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWG6bWdamaaBaaaleaapeGaamiCaaWdaeqaaOWdbiabg2da9iaa dggapaWaaSbaaSqaa8qacaWGWbGaaiilaiaaigdaa8aabeaak8qaca WG4bWdamaaBaaaleaapeGaaGymaaWdaeqaaOWdbiabgUcaRiaadgga paWaaSbaaSqaa8qacaWGWbGaaiilaiaaikdaa8aabeaak8qacaWG4b WdamaaBaaaleaapeGaaGOmaaWdaeqaaOWdbiabgUcaRiaac6cacaGG UaGaey4kaSIaamyya8aadaWgaaWcbaWdbiaadchacaGGSaGaamiCaa WdaeqaaOWdbiaadIhapaWaaSbaaSqaa8qacaWGWbaapaqabaaaaa@4F9D@

Les composantes principales sont calculées comme des combinaisons linéaires des variables d’entrée (la série mensuelle). La première composante principale explique la plus importante proportion de la variance des variables d’entrée. C’est le vecteur propre associé à la plus grande valeur propre. La deuxième composante principale est orthogonale (sans corrélation) avec la première composante principale et est le vecteur propre associé à la deuxième plus grande valeur propre. Elle explique la deuxième composante la plus importante des variables d’entrée. On peut donc dire qu’elle mesure une différente dimension statistique des séries disponibles. La troisième composante principale est orthogonale aux deux premières et mesure la troisième plus grande proportion de variance dans les données. Et ainsi de suite jusqu’à la p e MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWGWbWdamaaCaaaleqabaWdbiaadshacaWGObaaaaaa@393E@ composante principale.

Pour mettre en œuvre l’ACP ici, les principales composantes utilisées pour l’estimation du modèle et les chargements sont déterminées en employant la série chronologique mensuelle de la variance winsorisée et centrée au niveau des unités. Les chargements sont ensuite appliqués à la série brute non winsorisée pour produire les composantes principales brutes utilisées pour prédire les taux de croissance mensuels.

Lorsque l’ACP fonctionne bien, une grande partie de la variance d’un ensemble de données peut être expliquée par les premières composantes principales, et seules les premières composantes principales sont utilisées pour l’analyse. Malheureusement, dans le cas de l’ensemble de données d’entrée pour les économies provinciales et territoriales, l’ACP ne fonctionne pas bien pour réduire la portée des renseignements contenus dans l’ensemble de données (tableau 4). La première composante principale représente généralement moins de 10 % de la variation dans l’ensemble de données. De plus, lorsqu’on établit une moyenne pour produire une estimation de la fréquence annuelle, la première composante principale ne correspond pas bien à la croissance annuelle du PIB réel pour la plupart des provinces et des territoires (tableau 5).


Tableau 4
Pourcentage de variation par composante principale
Sommaire du tableau
Le tableau montre les résultats de Pourcentage de variation par composante principale Composantes principales (figurant comme en-tête de colonne).
Composantes principales
1 2 3 4 5 6 7 8 9 10
Terre-Neuve-et-Labrador 10,5 16,2 21,0 25,4 29,7 33,3 36,6 39,7 42,6 45,3
Île-du-Prince-Édouard 12,1 19,5 25,7 31,2 35,2 39,1 42,7 46,0 49,2 52,2
Nouvelle-Écosse 9,0 15,2 20,6 24,9 28,5 32,0 35,2 38,3 41,1 43,8
Nouveau-Brunswick 9,6 16,4 21,3 25,8 29,8 33,6 37,3 40,4 43,4 46,3
Québec 7,0 13,0 17,8 21,9 25,5 28,7 31,6 34,3 37,0 39,7
Ontario 8,9 14,6 19,3 23,1 26,4 29,6 32,5 35,3 37,8 40,2
Manitoba 7,9 13,6 19,2 23,8 27,3 30,7 34,0 37,2 39,9 42,6
Saskatchewan 8,6 14,5 19,7 24,4 28,7 32,0 35,1 38,0 40,9 43,6
Alberta 10,5 16,4 21,5 25,9 29,5 33,0 36,1 39,0 41,7 44,3
Colombie-Britannique 8,6 14,7 20,2 25,3 29,4 32,8 35,8 38,6 41,3 44,0
Yukon 14,2 24,8 33,8 39,8 45,1 50,2 54,9 59,3 63,4 67,5
Territoires du Nord-Ouest 17,8 30,6 37,6 44,3 50,3 56,1 61,4 66,6 71,4 76,1
Nunavut 35,8 49,4 62,6 73,6 83,7 92,5 98,1 99,6 100,0 Note ...: n'ayant pas lieu de figurer

Les corrélations indiquent qu’en dehors de l’Alberta, de la Colombie-Britannique et de l’Ontario, le fait d’utiliser uniquement la première composante principale ne produira pas un indice d’activité qui fournit une mesure adéquate pour déterminer le rendement des provinces et des territoires en fonction des fluctuations mensuelles agrégées. Par conséquent, un indice d’activité basé uniquement sur la première composante principale, comme celui produit par le la Federal Reserve Board of Chicago (Federal Reserve Board of Chicago 2020, Brave et Butters 2010, Evans et Pham-Kanter 2002), n’est pas poursuivi ici.


Tableau 5
Corrélation entre la première composante principale et la croissance annuelle du produit intérieur brut (PIB) réel
Sommaire du tableau
Le tableau montre les résultats de Corrélation entre la première composante principale et la croissance annuelle du produit intérieur brut (PIB) réel Indice winsorisé et Indice non winsorisé(figurant comme en-tête de colonne).
Indice winsorisé Indice non winsorisé
Terre-Neuve-et-Labrador -0,349 -0,256
Île-du-Prince-Édouard -0,199 -0,307
Nouvelle-Écosse 0,531 0,491
Nouveau-Brunswick -0,709 -0,673
Québec 0,657 0,661
Ontario 0,775 0,778
Manitoba 0,562 0,567
Saskatchewan 0,477 0,338
Alberta 0,937 0,940
Colombie-Britannique 0,840 0,848
Yukon 0,177 0,251
Territoires du Nord-Ouest 0,423 0,422
Nunavut 0,355 0,444

Bien que la première composante principale ait des difficultés à corréler avec les fluctuations annuelles du PIB réel, cela ne signifie pas qu’il n’y a aucun renseignement dans les premières composantes principales pour expliquer la croissance du PIB réel. Par conséquent, pour générer un modèle basé sur les composantes principales, les régressions sont effectuées sur toutes les combinaisons des 10 premières composantes principales en tant que variables explicatives pour expliquer la croissance du PIB réel. La régression qui maximise le R carré ajusté est ensuite sélectionnée en tant que modèle préféré. Cela produit 13 modèles qui fonctionnent raisonnablement bien pour expliquer la croissance du PIB réel. De plus, les modèles fonctionnent généralement bien pour expliquer la récession de 2008 et d’autres fluctuations propres à une province ou à un territoire.

3.1.3 Moindre contraction absolue et opérateur de sélection

Le LASSO est la solution à un problème d’optimisation restreint semblable aux MCO. Sous une régression linéaire classique, X = [ x 1 , x 2 , ... , x p ] MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWGybGaeyypa0ZaamWaa8aabaWdbiaadIhapaWaaSbaaSqaa8qa caaIXaaapaqabaGcpeGaaiilaiaadIhapaWaaSbaaSqaa8qacaaIYa aapaqabaGcpeGaaiilaiaac6cacaGGUaGaaiOlaiaacYcacaWG4bWd amaaBaaaleaapeGaamiCaaWdaeqaaaGcpeGaay5waiaaw2faaaaa@44F0@ est une matrice n x p contenant les variables prédictrices utilisées pour expliquer la variation dans un vecteur cible y MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWG5baaaa@3715@ de longueur n. Les coefficients pour la régression β ^ = [ β 0 ^ , ... , β p ^ ] MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacuaHYoGypaGbaKaapeGaeyypa0ZaamWaa8aabaWaaecaaeaapeGa eqOSdi2damaaBaaaleaapeGaaGimaaWdaeqaaaGccaGLcmaapeGaai ilaiaac6cacaGGUaGaaiOlaiaacYcapaWaaecaaeaapeGaeqOSdi2d amaaBaaaleaapeGaamiCaaWdaeqaaaGccaGLcmaaa8qacaGLBbGaay zxaaaaaa@45F0@ sont alors la solution au problème qui cherche à réduire la somme des erreurs quadratiques entre y MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWG5baaaa@3715@ et une combinaison linéaire des variables dans X MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWGybaaaa@36F4@ :

β ^ O L S | = argmin β i = 1 n ( y i β 0 β 1 x i 1 ... β p x i p ) 2 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacuaHYoGypaGbaKaadaWgaaWcbaWdbiaad+eacaWGmbGaam4uaaWd aeqaaOGaaiiFa8qacqGH9aqppaWaaCbeaeaapeGaaeyyaiaabkhaca qGNbGaaeyBaiaabMgacaqGUbaal8aabaWdbiabek7aIbWdaeqaaOWd bmaawahabeWcpaqaa8qacaWGPbGaeyypa0JaaGymaaWdaeaapeGaam OBaaqdpaqaa8qacqGHris5aaGccaGGOaGaamyEa8aadaWgaaWcbaWd biaadMgaa8aabeaak8qacqGHsislcqaHYoGypaWaaSbaaSqaa8qaca aIWaaapaqabaGcpeGaeyOeI0IaeqOSdi2damaaBaaaleaapeGaaGym aaWdaeqaaOWdbiaadIhapaWaaSbaaSqaa8qacaWGPbGaaGymaaWdae qaaOWdbiabgkHiTiaac6cacaGGUaGaaiOlaiabgkHiTiabek7aI9aa daWgaaWcbaWdbiaadchaa8aabeaak8qacaWG4bWdamaaBaaaleaape GaamyAaiaadchaa8aabeaak8qacaGGPaWdamaaCaaaleqabaWdbiaa ikdaaaaaaa@6485@

Le LASSO (Tibshirani 1996) fait partie d’une classe d’estimateurs qui cherche à pénaliser l’estimateur des MCO pour ajustement excessif (c.-à-d. inclure trop de variables) au moyen de son paramètre de régulation λ MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacqaH7oaBaaa@37CB@ . On pourrait comparer cela à l’utilisation d’un R carré ajusté ou d’un critère de renseignement pour pénaliser l’inclusion d’un trop grand nombre de variables explicatives. Cependant, cela va plus loin que de pénaliser à cause de variables explicatives supplémentaires quand on regarde la qualité du modèle. Cela sélectionne des variables pertinentes. Le LASSO est la solution pour :

β ^ L A S S O | = argmin β [ i = 1 n ( y i β 0 β 1 x i 1 ... β p x i p ) 2 + λ j = 1 p ( | β j | ) ] MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacuaHYoGypaGbaKaadaWgaaWcbaWdbiaadYeacaWGbbGaam4uaiaa dofacaWGpbaapaqabaGccaGG8bWdbiabg2da98aadaWfqaqaa8qaca qGHbGaaeOCaiaabEgacaqGTbGaaeyAaiaab6gaaSWdaeaapeGaeqOS digapaqabaGcpeWaamWaa8aabaWdbmaawahabeWcpaqaa8qacaWGPb Gaeyypa0JaaGymaaWdaeaapeGaamOBaaqdpaqaa8qacqGHris5aaGc caGGOaGaamyEa8aadaWgaaWcbaWdbiaadMgaa8aabeaak8qacqGHsi slcqaHYoGypaWaaSbaaSqaa8qacaaIWaaapaqabaGcpeGaeyOeI0Ia eqOSdi2damaaBaaaleaapeGaaGymaaWdaeqaaOWdbiaadIhapaWaaS baaSqaa8qacaWGPbGaaGymaaWdaeqaaOWdbiabgkHiTiaac6cacaGG UaGaaiOlaiabgkHiTiabek7aI9aadaWgaaWcbaWdbiaadchaa8aabe aak8qacaWG4bWdamaaBaaaleaapeGaamyAaiaadchaa8aabeaak8qa caGGPaWdamaaCaaaleqabaWdbiaaikdaaaGccqGHRaWkcqaH7oaBda GfWbqabSWdaeaapeGaamOAaiabg2da9iaaigdaa8aabaWdbiaadcha a0WdaeaapeGaeyyeIuoaaOGaaiikamaaemaapaqaa8qacqaHYoGypa WaaSbaaSqaa8qacaWGQbaapaqabaaak8qacaGLhWUaayjcSdGaaiyk aaGaay5waiaaw2faaaaa@78C8@

Le paramètre λ 0 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacqaH7oaBcqGHLjYScaaIWaaaaa@3A4B@ contrôle la force de la pénalité; plus la valeur de lambda est grande, plus la valeur du rétrécissement est importante. L’algorithme LASSO peut uniquement inclure des valeurs pour β j MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacqaHYoGypaWaaSbaaSqaa8qacaWGQbaapaqabaaaaa@3901@ jusqu’à un total absolu précis. Par conséquent, le LASSO fixe à 0 les coefficients variables moins importants. On peut considérer cela comme semblable au type de résultat trouvé en employant une stratégie de modélisation générale à spécifique/guidée par descriptions approximatives, mais qui est applicable à plus grande échelle. Le résultat est une méthode pour traiter de grands ensembles de données où un grand nombre de prédicteurs peuvent être inclus, et l’algorithme sélectionnera ceux dont les propriétés de covariance sont les plus importantes pour prédire la variable cible ( y MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWG5baaaa@3715@ ).

Le LASSO a lui aussi des limites. Dans les cas où les groupes de variables prédictives sont fortement corrélés les uns aux autres, le LASSO tend à garder une variable de chaque groupe et à contracter le coefficient des autres variables à zéro. Et dans d’autres cas, lorsque l’ensemble de données a un petit n et un grand p, le LASSO sélectionne au maximum n variables avant d’être saturé. Cependant, il peut y avoir plus de variables n avec un coefficient qui n’est pas égal à zéro dans le vrai modèle.

La méthode elastic-net (Zou et Hastie, 2005) est une extension du LASSO. En contrôlant le poids de pénalité α MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacqaHXoqyaaa@37B6@ , le modèle elastic-net stabilise la sélection des variables à partir d’un groupe de variables corrélées et supprime la limite au nombre de variables sélectionnées. Les coefficients sont estimés comme suit :

β ^ E N À = argmin β { i = 1 n ( y i β 0 β 1 x i 1 ... β p x i p ) 2 + λ j = 1 p [ 1 2 ( 1 α ) β j 2 + α | β j | ] } MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacuaHYoGypaGbaKaadaWgaaWcbaWdbiaadweacaWGobaapaqabaGc caWGadWdbiabg2da98aadaWfqaqaa8qacaqGHbGaaeOCaiaabEgaca qGTbGaaeyAaiaab6gaaSWdaeaapeGaeqOSdigapaqabaGcpeWaaiWa a8aabaWdbmaawahabeWcpaqaa8qacaWGPbGaeyypa0JaaGymaaWdae aapeGaamOBaaqdpaqaa8qacqGHris5aaGccaGGOaGaamyEa8aadaWg aaWcbaWdbiaadMgaa8aabeaak8qacqGHsislcqaHYoGypaWaaSbaaS qaa8qacaaIWaaapaqabaGcpeGaeyOeI0IaeqOSdi2damaaBaaaleaa peGaaGymaaWdaeqaaOWdbiaadIhapaWaaSbaaSqaa8qacaWGPbGaaG ymaaWdaeqaaOWdbiabgkHiTiaac6cacaGGUaGaaiOlaiabgkHiTiab ek7aI9aadaWgaaWcbaWdbiaadchaa8aabeaak8qacaWG4bWdamaaBa aaleaapeGaamyAaiaadchaa8aabeaak8qacaGGPaWdamaaCaaaleqa baWdbiaaikdaaaGccqGHRaWkcqaH7oaBdaGfWbqabSWdaeaapeGaam OAaiabg2da9iaaigdaa8aabaWdbiaadchaa0WdaeaapeGaeyyeIuoa aOWaamWaa8aabaWdbmaalaaapaqaa8qacaaIXaaapaqaa8qacaaIYa aaamaabmaapaqaa8qacaaIXaGaeyOeI0IaeqySdegacaGLOaGaayzk aaGaeqOSdi2damaaDaaaleaapeGaamOAaaWdaeaapeGaaGOmaaaaki abgUcaRiabeg7aHnaaemaapaqaa8qacqaHYoGypaWaaSbaaSqaa8qa caWGQbaapaqabaaak8qacaGLhWUaayjcSdaacaGLBbGaayzxaaaaca GL7bGaayzFaaaaaa@847C@

0 α 1 MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaaIWaGaeyizImQaeqySdeMaeyizImQaaGymaaaa@3C95@ est la pondération de pénalité. Comme α MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacqaHXoqyaaa@37B6@ est égal à 1, le modèle elastic-net est le même que pour le modèle LASSO et, comme α MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacqaHXoqyaaa@37B6@ est proche de 1, le modèle elastic-net se comporte de façon semblable au LASSO, mais élimine le comportement problématique causé par de fortes corrélations entre les variables.

Les données de sortie du LASSO en matière du nombre de variables sélectionnées et de leur importance statistique ont été soigneusement étudiées. Dans presque tous les cas où le LASSO fonctionnait, le LASSO semble inclure dans le modèle des variables qui ne sont pas statistiquement importantes. Pour s’assurer que la relation entre le y cible et les variables explicatives est justifiable avec un meilleur résultat statistique, une analyse graduelle par régression avec sélection descendante est utilisée sur les variables sélectionnées par le LASSO pour enlever les variables non significatives du modèle.

L’analyse graduelle par régression est une méthode qui examine l’importance statistique de chaque variable indépendante au sein du modèle. Elle construit un modèle en ajoutant successivement (sélection ascendante) ou en supprimant (sélection descendante) des variables en fonction des statistiques t de leurs coefficients estimés. La méthode d’élimination descendante commence par l’inclusion de toutes les variables dans le modèle, puis chaque variable est supprimée une par une, pour tester son importance. Les variables qui ne sont pas statistiquement significatives sont enlevées du modèle.

Le modèle LASSO n’a pas choisi de variables pour le Nouveau-Brunswick, la Nouvelle-Écosse, l’Ontario et les Territoires du Nord-Ouest. La méthode elastic-net est utilisée à sa place pour ces provinces et territoires. Et pour les deux autres territoires, le Yukon et le Nunavut, une analyse graduelle par régression manuelle est effectuée.

Dans les deux méthodes, LASSO et elastic-net, la validation croisée du progiciel caret R est utilisée pour ajuster les paramètres lambda et alpha. La validation croisée utilise une technique de prévision continue de l’origine (Hyndman et Athanasopoulos, 2014) au lieu de l’échantillonnage aléatoire simple. Cette technique est propre aux ensembles de données des séries chronologiques.

4 Évaluation mensuelle de l’indice

Les trois approches présentent en outre des points forts et des points faibles qui leur sont propres, et qui ont une incidence sur leur utilisation (tableau 6). Les indices simples et le LASSO ont pour avantage que leurs modèles sont parcimonieux et que les indices qu’ils produisent sont moins bruyants que les indices fondés sur l’ACP. Cependant, ces indices sont basés sur un ensemble de variables très réduit, qui sont souvent non statistiquement significatives pour les indices simples dans les régressions annuelles. Ces indices tendent aussi à mettre l’accent sur les séries relatives à l’emploi plutôt que sur un large éventail d’activités économiques et peuvent, par conséquent, ne pas présenter de valeurs explicatives idéales des fluctuations mensuelles de l’activité, si les variations de la production ne rendent pas compte au même moment des variables d’emploi.

L’indice ACP a pour avantage que la méthodologie est saine et bien comprise. Il fonctionne pour toutes les provinces et tous les territoires. Cependant, il produit les indices d’activité les plus bruyants, rendant leur interprétation difficile; de plus, dans certains cas (p. ex. T.-N.), l’indice peut diminuer brusquement. Les indices ACP sont aussi combinés en fonction de la maximisation du R carré ajusté d’une régression à l’autre. Cela produit une combinaison linéaire des composantes principales qui sont statistiquement significatives et non significatives. Ces inclusions préfèrent ajouter des renseignements supplémentaires qui incluent un certain bruit, car il n’est pas clair que les données à une fréquence annuelle représentent la variabilité d’un mois à l’autre.


Tableau 6
Caractéristiques des méthodes d’estimation d’indice
Sommaire du tableau
Le tableau montre les résultats de Caractéristiques des méthodes d’estimation d’indice. Les données sont présentées selon Critère (titres de rangée) et Indice simple, Indice ACP, Indice pondéré et Indice LASSO(figurant comme en-tête de colonne).
Critère Indice simple Indice ACP Indice pondéré Indice LASSO
Données d’entrée cohérentes pour tous les niveaux géographiques Oui Non Non Non
Modèle-types cohérents pour tous les niveaux géographiques Oui Oui Oui Non
Spécification du modèle Trois données d’entrée, quelques variables non significatives Nombre variable de composantes principales. Quelques variables non significatives Combinaison des indices simples et ACP Sélection de données d’entrée variable
Adéquation du modèle Adéquation du modèle peut varier entre les provinces et les territoires Adéquation généralement bonne pour l’échantillon Adéquation pour l’échantillon améliorée par rapport aux indices simples et ACP Adéquation généralement bonne pour l’échantillon
Intelligibilité Données d’entrée et contributions faciles à comprendre Difficile de comprendre ce qui contribue aux variations

Difficile d’interpréter les composantes principales

Indices à variabilité élevée
Difficile de comprendre ce qui contribue aux variations Données d’entrée fondées sur des corrélations

Contributions pouvant être interprétées

Indice à faible variance
Adéquation du modèle Ces modèles peuvent ne pas être efficaces selon l’importance statistique

Les données d’entrée reflètent les attentes pour les variables importantes.
Ces modèles peuvent ne pas être efficaces selon l’importance statistique

Utilisation exhaustive des données d’entrée
Hérite des propriétés des indices de données d’entrée Approche de modélisation non adaptée à la configuration actuelle

La combinaison des indices fournit une méthode supplémentaire pour leur utilisation. Puisque l’indice simple est relativement stable, mais se concentre sur un nombre limité de séries fondamentales, et que l’indice ACP est plus variable, mais comprend des combinaisons linéaires de toutes les entrées, ces séries sont combinées pour fournir un indice pondéré présentant de meilleures caractéristiques que les composantes. Pour toutes les méthodes, les indices produits génèrent généralement des types similaires de renseignements sur les cycles économiques et les principaux chocs économiques dans les provinces et les territoires. Comme pour les coefficients de régression, la croissance annuelle du PIB réel est utilisée comme comparaison, car elle constitue la principale source d’activité économique agrégée qui est disponible pour les provinces et les territoires. Pour combiner l’indice ACP et l’indice simple, les valeurs de degré de liberté entre 1 % et 100 % sont utilisées pour créer des indices pondérés comme suit :

i n d i c e _ p o n d é r é = ( 1 ν ) * i n d i c e _ s i m p l e + ν * i n d i c e _ d ' a c t i v i t é MathType@MTEF@5@5@+= feaagKart1ev2aqatCvAUfeBSjuyZL2yd9gzLbvyNv2CaerbuLwBLn hiov2DGi1BTfMBaeXatLxBI9gBaerbd9wDYLwzYbItLDharqqtubsr 4rNCHbGeaGqiVu0Je9sqqrpepC0xbbL8F4rqqrFfpeea0xe9Lq=Jc9 vqaqpepm0xbba9pwe9Q8fs0=yqaqpepae9pg0FirpepeKkFr0xfr=x fr=xb9adbaqaaeGaciGaaiaabeqaamaabaabaaGcbaaeaaaaaaaaa8 qacaWG3bGaamyzaiaadMgacaWGNbGaamiAaiaadshacaWGLbGaamiz aiaac+facaWGPbGaamOBaiaadsgacaWGLbGaamiEaiabg2da9maabm aapaqaa8qacaaIXaGaeyOeI0IaeqyVd4gacaGLOaGaayzkaaGaaiOk aiaadohacaWGPbGaamyBaiaadchacaWGSbGaamyzaiaac+facaWGPb GaamOBaiaadsgacaWGLbGaamiEaiabgUcaRiabe27aUjaacQcacaWG HbGaam4yaiaadshacaWGPbGaamODaiaadMgacaWG0bGaamyEaiaac+ facaWGPbGaamOBaiaadsgacaWGLbGaamiEaaaa@658D@

Le degré de liberté correspondant à l’indice pondéré qui a la plus forte corrélation avec la croissance du PIB réel est alors sélectionné.

Les méthodes utilisées pour produire des indices mensuels donnent généralement des types semblables de renseignements sur les cycles économiques et les chocs économiques majeurs dans les provinces et les territoires. À titre d’exemples, les indices pour l’Alberta (panel 1) et Terre-Neuve-et-Labrador (panel 2) sont présentés ci-dessous.

Dans le cas d’une économie plus vaste, comme celle de l’Alberta, toutes les approches donnent des renseignements similaires sur les périodes de croissance ou de déclin, mais l’ampleur des cycles peut varier selon la méthodologie. En général, les indices basés sur l’ACP ont la plus grande variabilité, alors que l’indice simple a le moins de variabilité. Dans certains cas, comme l’indice ACP pour Terre-Neuve-et-Labrador, le modèle ne produit pas un résultat raisonnable. Dans ces cas, l’indice ne sera pas rendu disponible et est jugé impropre à l’utilisation. Néanmoins, lorsque les indices semblent présenter les caractéristiques appropriées, il y a une forte corrélation entre les mesures de l’activité économique implicite et le mouvement des indices dans le temps correspond à ce que l’on sait sur la performance économique des provinces et des territoires.

De plus, les comparaisons avec les estimations sous-annuelles du PIB réel pour l’Ontario et le Québec montrent que les taux de croissance d’une année à l’autre sont fortement corrélés, mais que les cycles économiques peuvent être accentués dans les indices d’activité. Les indices semblent donc saisir des renseignements pertinents pour les cycles économiques, les périodes de croissance plus forte ou plus faible et pour comprendre la performance économique. Ils ne correspondent toutefois pas directement au PIB réel et ne doivent pas être interprétés comme une mesure directe du PIB réel.

Graphique 1

Tableau de données du graphique 1 
Tableau de données du graphique 1
Sommaire du tableau
Le tableau montre les résultats de Tableau de données du graphique 1 Indice d’activité basé sur les composantes principales, Indice simple, Indice pondéré et Indice basé sur le LASSO, calculées selon niveau de l'indice unités de mesure (figurant comme en-tête de colonne).
Indice d’activité basé sur les composantes principales Indice simple Indice pondéré Indice basé sur le LASSO
niveau de l'indice
01/01/2002 44,02 46,61 43,8 53,41
01/02/2002 42,57 47,96 43,94 54,03
01/03/2002 43,38 46,68 43,61 53,1
01/04/2002 43,66 47,1 43,95 52,9
01/05/2002 42,7 47,27 43,63 53,07
01/06/2002 46,2 48,41 45,75 54,21
01/07/2002 48,41 48,82 46,9 54,67
01/08/2002 49,49 51,78 48,98 56,37
01/09/2002 48,55 51,02 48,18 55,53
01/10/2002 48,16 51,42 48,23 55,81
01/11/2002 48,55 51,27 48,32 55,87
01/12/2002 51,29 51,54 49,6 56,95
01/01/2003 49,35 51,91 49,03 56,81
01/02/2003 50,07 50,62 48,62 56,36
01/03/2003 49,06 52,54 49,28 57,45
01/04/2003 46,89 51,99 48,06 57,38
01/05/2003 51,1 51,61 49,67 57,31
01/06/2003 51,11 51,9 49,84 57,42
01/07/2003 53,42 51,25 50,42 57,95
01/08/2003 54,38 50,81 50,55 57,93
01/09/2003 55,08 51,13 51,01 58,18
01/10/2003 58,9 53,63 53,94 60,27
01/11/2003 57,34 53,12 53,04 59,42
01/12/2003 58,65 51,93 52,87 58,7
01/01/2004 58,52 53,3 53,62 59,04
01/02/2004 57,42 52,46 52,71 58,44
01/03/2004 61,58 54,96 55,77 60,01
01/04/2004 63,78 57,09 57,86 61,91
01/05/2004 64,62 58,28 58,88 62,76
01/06/2004 63,31 58,73 58,64 62,47
01/07/2004 63,92 59,92 59,57 63,02
01/08/2004 67,74 61,08 61,74 63,31
01/09/2004 72,25 64,06 65,2 64,77
01/10/2004 69,04 63,96 63,93 64,7
01/11/2004 71,06 65,47 65,59 65,95
01/12/2004 75,37 68,87 69,24 67,56
01/01/2005 74,58 68,91 68,95 66,55
01/02/2005 78,88 70,83 71,74 68,35
01/03/2005 79,81 71,25 72,34 69,63
01/04/2005 83,03 74,76 75,64 70,38
01/05/2005 86,59 78,15 78,99 72,45
01/06/2005 86,26 77,58 78,53 72,65
01/07/2005 90,69 80,97 82,21 74,71
01/08/2005 92,54 82,08 83,57 75,23
01/09/2005 89,46 82,22 82,48 75,36
01/10/2005 93,96 83,52 84,98 76
01/11/2005 99,23 84,08 87,32 76,41
01/12/2005 105,42 86,85 91,27 77,9
01/01/2006 112,03 92,56 97,16 81,19
01/02/2006 124,82 97,78 104,99 86,05
01/03/2006 129,22 98,89 107,23 85,29
01/04/2006 131,71 104,09 111,37 87,32
01/05/2006 151,64 108,36 121,1 90,3
01/06/2006 157,75 114,43 127,09 92,96
01/07/2006 155,85 111,55 124,59 92,11
01/08/2006 154,08 110,1 123,06 91,1
01/09/2006 158,42 114,46 127,34 94,08
01/10/2006 164,81 114,27 129,37 95,42
01/11/2006 189,61 123,48 143,6 99,53
01/12/2006 182,2 129,73 145,46 100,77
01/01/2007 190,56 134,1 151,1 102,35
01/02/2007 198,82 136,14 155,18 103,41
01/03/2007 198,63 138,32 156,56 105,25
01/04/2007 199,1 134,66 154,32 102,72
01/05/2007 190,58 133,71 150,91 102,79
01/06/2007 206,86 138,25 159,3 104,63
01/07/2007 206,74 135,7 157,55 104,9
01/08/2007 221,09 137,19 163,15 106,49
01/09/2007 212,06 134,81 158,71 104,74
01/10/2007 212,26 137,38 160,52 105,98
01/11/2007 222,26 136,46 163,08 105,2
01/12/2007 214,99 134,42 159,43 105,75
01/01/2008 213,26 139,22 162,19 107,36
01/02/2008 210,38 137,17 159,88 105,66
01/03/2008 229,88 145,51 171,75 109,47
01/04/2008 227,03 147,08 171,93 111,48
01/05/2008 217,63 143,91 166,79 110,19
01/06/2008 224,1 146,92 170,9 111,12
01/07/2008 228,86 148,4 173,41 111,88
01/08/2008 231,95 154,54 178,56 113,96
01/09/2008 245,26 151,44 180,79 113,02
01/10/2008 251,6 152,78 183,68 113,92
01/11/2008 226,74 146,33 171,56 110,44
01/12/2008 199,86 140,83 159,28 106,41
01/01/2009 184,33 130,35 147,21 101,74
01/02/2009 152,56 123,85 132,29 98,07
01/03/2009 132,39 110,29 116,55 91,91
01/04/2009 120,77 104,76 108,86 88,75
01/05/2009 117,82 104,35 107,49 86,86
01/06/2009 111,94 97,83 101,34 84,4
01/07/2009 109,03 97,57 100,08 83,67
01/08/2009 96,8 87,94 89,64 79,63
01/09/2009 103,38 89,66 93,21 80,47
01/10/2009 95,74 87,62 89,09 78,73
01/11/2009 98,14 86,53 89,38 78,59
01/12/2009 101,93 86,01 90,52 78,65
01/01/2010 104,88 91,76 95,14 80,38
01/02/2010 101,29 91,16 93,4 79,83
01/03/2010 106,13 92,36 96 80,49
01/04/2010 112,77 93,93 99,46 82,04
01/05/2010 114,31 93,21 99,59 82,08
01/06/2010 114,69 95,96 101,43 83,79
01/07/2010 113,32 97,73 102,01 83,77
01/08/2010 114,88 97,17 102,26 83,54
01/09/2010 115,52 99,14 103,7 85,08
01/10/2010 123,24 102,62 108,72 87,49
01/11/2010 117,97 100,26 105,32 87,09
01/12/2010 124,56 105,13 110,76 89,72
01/01/2011 129,69 103,5 111,68 89,83
01/02/2011 139,07 106,75 117,11 92,08
01/03/2011 142,32 108,93 119,64 92,54
01/04/2011 150,84 113,07 125,29 94,7
01/05/2011 143,64 111,31 121,65 93,88
01/06/2011 159,07 118,1 131,44 97,47
01/07/2011 162,9 121,64 135,05 98,81
01/08/2011 170,97 121,2 137,58 99,78
01/09/2011 177,27 125,39 142,46 102,34
01/10/2011 181,7 126,83 144,91 103,3
01/11/2011 187,92 130,88 149,68 105,69
01/12/2011 202,43 135,47 157,58 108,6
01/01/2012 200,04 136,08 157,21 108,2
01/02/2012 203,94 137,33 159,33 107,93
01/03/2012 215,35 143,44 167,19 111,99
01/04/2012 231,23 147,11 174,84 113,99
01/05/2012 246,96 158,95 188 119,03
01/06/2012 245,54 163,36 190,57 121,09
01/07/2012 251,4 163,48 192,57 121,8
01/08/2012 255,07 167,99 196,83 123,66
01/09/2012 256,26 166,98 196,53 122,35
01/10/2012 256,04 163,98 194,41 121,8
01/11/2012 282,48 168,88 206,21 124,01
01/12/2012 257,26 162,99 194,31 121,25
01/01/2013 269,64 166,71 200,8 123,41
01/02/2013 278,58 174,14 208,79 126,47
01/03/2013 285,1 178,01 213,54 128,04
01/04/2013 284,24 178,9 213,88 129,26
01/05/2013 295,09 181,18 218,89 130,5
01/06/2013 276,77 180,16 212,47 129,64
01/07/2013 293,1 185,99 221,72 132,52
01/08/2013 308,64 190,45 229,75 134,29
01/09/2013 297,08 187,28 223,91 134,34
01/10/2013 303,6 193,58 230,35 136,04
01/11/2013 309,71 194,63 233,02 136,76
01/12/2013 300,19 192,49 228,53 136,8
01/01/2014 305,95 195,89 232,71 138,24
01/02/2014 331,2 199,63 243,35 139,67
01/03/2014 320 202,51 241,93 139,89
01/04/2014 306,86 206,6 240,59 141,57
01/05/2014 338,35 210,18 253,38 144,25
01/06/2014 360,37 217,84 265,66 145,48
01/07/2014 362,64 217,87 266,39 146,54
01/08/2014 365,55 228,27 274,66 149,51
01/09/2014 380,11 229,51 280,12 152,28
01/10/2014 375,74 229,38 278,68 153,12
01/11/2014 352,84 218,69 264,01 149,41
01/12/2014 366,34 218,46 268,09 149,61
01/01/2015 361,92 217,89 266,33 151,59
01/02/2015 306,55 204,05 239,4 143,6
01/03/2015 299,28 197,25 232,39 140,47
01/04/2015 295,88 191,31 227,22 139,19
01/05/2015 281,93 189,24 221,3 136,94
01/06/2015 260,26 175,06 204,53 131,56
01/07/2015 252,67 173,31 200,84 130,75
01/08/2015 230,04 163,62 186,78 126,55
01/09/2015 231,82 162,33 186,53 124,92
01/10/2015 211,19 158,65 177,11 123,26
01/11/2015 199,83 154,68 170,53 120,67
01/12/2015 194,02 151,04 166,12 118,77
01/01/2016 168,77 137,88 148,65 112,8
01/02/2016 155,99 129,98 138,98 108,6
01/03/2016 157,89 128,71 138,91 108,89
01/04/2016 152,23 128,23 136,51 106,99
01/05/2016 122,95 118,24 119,31 102,17
01/06/2016 123,07 118,25 119,37 101,38
01/07/2016 123,43 116,97 118,77 100,09
01/08/2016 119,78 110,53 113,5 97,46
01/09/2016 120,69 109,76 113,4 97,07
01/10/2016 118,47 106,32 110,47 96,07
01/11/2016 114,29 105,29 108,2 94,64
01/12/2016 115,2 106,63 109,37 96,17
01/01/2017 114,58 105,27 108,31 95,49
01/02/2017 122,6 109,75 114,17 98,4
01/03/2017 119,37 107,19 111,36 96,66
01/04/2017 122,15 107,16 112,44 96,39
01/05/2017 132,14 110,7 118,45 98,47
01/06/2017 136,75 115,5 123,16 101,72
01/07/2017 134,51 115,82 122,52 102,28
01/08/2017 134,36 116,62 122,94 102,25
01/09/2017 133,1 116,94 122,66 102,76
01/10/2017 138,57 114,98 123,58 102,86
01/11/2017 139,61 113,7 123,17 102,16
01/12/2017 136,83 113,16 121,81 102,4
01/01/2018 137,46 114,2 122,69 102,85
01/02/2018 138,15 112,28 121,76 102,74
01/03/2018 145,44 115,03 126,19 104,34
01/04/2018 141,36 114,17 124,15 105,22
01/05/2018 143,43 116,15 126,16 106,82
01/06/2018 135,88 115,2 122,77 106,09
01/07/2018 127,34 109,22 115,84 102,31
01/08/2018 132,52 110,19 118,41 103,62
01/09/2018 127,19 108,21 115,18 101,71
01/10/2018 124,91 109,43 115,06 102,67
01/11/2018 140,51 108,39 120,46 104,76
01/12/2018 122,05 105,9 112,21 102,77
01/01/2019 121,52 108,71 113,73 103,86
01/02/2019 119,51 107,99 112,51 104,21
01/03/2019 117,9 106,8 111,15 103,37
01/04/2019 120,14 106,63 111,94 103,2
01/05/2019 118,47 106,15 110,99 103,11
01/06/2019 120,62 104,4 110,78 102,44
01/07/2019 115,19 106,68 110,08 102,69
01/08/2019 112,98 106,6 109,15 103,03
01/09/2019 113,06 104,25 107,79 103,06
01/10/2019 112,01 103,32 106,81 102,05
01/11/2019 101,43 101,08 101,22 100,56
01/12/2019 100 100 100 100
01/01/2020 95,17 96,91 96,18 99,03
01/02/2020 95,22 91,26 92,95 96,41
01/03/2020 36,95 55,25 47,79 72,21

Graphique 2

Tableau de données du graphique 2 
Tableau de données du graphique 2
Sommaire du tableau
Le tableau montre les résultats de Tableau de données du graphique 2 Indice d’activité basé sur les composantes principales, Indice simple, Indice pondéré et Index basé sur le LASSO, calculées selon niveau de l'indice unités de mesure (figurant comme en-tête de colonne).
Indice d’activité basé sur les composantes principales Indice simple Indice pondéré Index basé sur le LASSO
niveau de l'indice
01/01/2002 5562,24 79,43 85,09 80,21
01/02/2002 5224,48 82,88 87,45 78,31
01/03/2002 4243,91 82,37 84,54 78,13
01/04/2002 5626,24 84,65 90,65 80,77
01/05/2002 6239,63 81,43 89,2 82,66
01/06/2002 5657,11 81,77 88,28 83,57
01/07/2002 6292,55 82,05 90,01 84,18
01/08/2002 5814,76 82,49 89,4 83,92
01/09/2002 6267,22 82,16 90,14 85,7
01/10/2002 7667,45 82,73 93,69 89,83
01/11/2002 7413,24 82,92 93,41 91,66
01/12/2002 6900,72 82,58 92,12 90,72
01/01/2003 6240,78 82,16 90,4 92,15
01/02/2003 7319,34 81,15 91,79 93,04
01/03/2003 8199,98 81,5 93,79 95,4
01/04/2003 8855,62 80,74 94,17 91,16
01/05/2003 4712,39 81,16 87,98 88,97
01/06/2003 4942,04 81,57 89 91,22
01/07/2003 6042,07 81,75 92,14 92,7
01/08/2003 5297,57 82,13 90,8 90,71
01/09/2003 5638,03 81,89 91,45 92,14
01/10/2003 5705,55 82,33 92,03 89,2
01/11/2003 6637,96 80,51 92,55 91,53
01/12/2003 6354,64 80,75 92,2 92,96
01/01/2004 6377,55 83,85 95,26 94,08
01/02/2004 5984,01 83,32 93,86 93,11
01/03/2004 5781,09 84,31 94,33 92,74
01/04/2004 8976,38 83,1 101 93,32
01/05/2004 1043,44 82,13 86,61 89,81
01/06/2004 1157,32 84,15 89,84 92,31
01/07/2004 919,54 83 86,03 92,46
01/08/2004 1002,15 82,87 87,07 93,35
01/09/2004 1046,54 82,96 87,73 93,51
01/10/2004 956,18 83,13 86,75 91,98
01/11/2004 1082,97 83,53 88,83 93,92
01/12/2004 1096,23 82,95 88,47 93,98
01/01/2005 1116,83 82,75 88,53 93,83
01/02/2005 1076,08 83,74 88,95 95,46
01/03/2005 1129 82,7 88,67 94,95
01/04/2005 1016,3 83,22 87,82 93,02
01/05/2005 1098,25 81,74 87,55 91,89
01/06/2005 1176,3 82,06 88,78 92,55
01/07/2005 1088,7 82,72 88,39 93,77
01/08/2005 1129,19 82,43 88,62 94,73
01/09/2005 1369,72 82,15 91,19 97,08
01/10/2005 1143,89 81,95 88,75 96,92
01/11/2005 1272,18 82,39 90,65 97,13
01/12/2005 1155,15 82,72 89,71 96,55
01/01/2006 1105,85 83,92 90,24 97,59
01/02/2006 1022,72 83,8 89,11 96,3
01/03/2006 1259,88 82,88 91,38 98,09
01/04/2006 1598,84 85,67 97,68 100,91
01/05/2006 1009,01 84,61 91,25 97,97
01/06/2006 920,31 84,23 89,7 96,91
01/07/2006 1062,74 84,44 91,97 99,3
01/08/2006 1117,95 84,42 92,67 100,63
01/09/2006 962,48 84,22 90,55 98,02
01/10/2006 891,39 83,85 89,21 93,66
01/11/2006 515,95 84,98 84,6 95,24
01/12/2006 639,62 85,12 87,75 97,2
01/01/2007 718,78 85,51 89,72 98,18
01/02/2007 648,56 85,72 88,6 96
01/03/2007 670,28 86,26 89,51 99,94
01/04/2007 592,42 85,91 87,65 100,93
01/05/2007 762,1 86,63 92,04 101,5
01/06/2007 769,86 87,65 93,1 103,11
01/07/2007 518,87 87,32 88,25 101,85
01/08/2007 487,58 87,06 87,22 100,81
01/09/2007 499,02 87,96 88,3 100,92
01/10/2007 584,42 86,96 89,71 104,28
01/11/2007 276,1 87,64 83,21 105,64
01/12/2007 420,52 87,82 89,89 105,83
01/01/2008 397,36 88,9 90,08 107,45
01/02/2008 378,08 87,45 88,18 106,61
01/03/2008 381,3 88,94 89,56 107,61
01/04/2008 343,09 89,24 88,48 106,06
01/05/2008 382,96 89,14 89,94 109
01/06/2008 484,06 90,99 95,08 109,61
01/07/2008 552,41 91,47 97,52 111,14
01/08/2008 564,08 90,41 96,87 110,34
01/09/2008 496,56 91,21 95,86 108,02
01/10/2008 401,15 91,39 93,26 105,07
01/11/2008 395,31 89,98 91,83 106,9
01/12/2008 317,61 88,5 87,84 102,41
01/01/2009 315,15 87,29 86,72 100,27
01/02/2009 375,72 90,33 91,79 100,7
01/03/2009 309,45 89,43 88,58 98,69
01/04/2009 381 88,94 91,24 98,34
01/05/2009 227,61 89,52 86,23 95,2
01/06/2009 179,03 88,21 82,4 95,84
01/07/2009 187,74 88,7 83,39 94,13
01/08/2009 194,6 90,51 85,29 95,36
01/09/2009 186,3 89,79 84,18 92,3
01/10/2009 200,51 90,83 85,97 93,41
01/11/2009 236,33 90,01 87,61 95,4
01/12/2009 211,69 89,78 86,05 93,21
01/01/2010 192,67 90,29 85,3 93,07
01/02/2010 191,56 90,71 85,57 92,63
01/03/2010 187,44 90,41 85,05 91,48
01/04/2010 222,62 90,44 87,47 96,67
01/05/2010 186,31 90,45 85,34 97,23
01/06/2010 181,82 91,75 86,07 92,9
01/07/2010 195,99 90,85 86,36 93,1
01/08/2010 179,67 91,77 86,03 92,81
01/09/2010 150,84 91,84 84,01 93,32
01/10/2010 180,48 92,38 86,9 97,67
01/11/2010 221,21 92,94 90,29 99,72
01/12/2010 181,91 93,74 88,55 97,65
01/01/2011 206,77 93,54 90,21 98,85
01/02/2011 187,98 92,59 88,2 98,28
01/03/2011 201 95,23 91,25 98,67
01/04/2011 140,74 94,21 86,32 102,23
01/05/2011 162,37 93,96 88,11 102,39
01/06/2011 157,52 93,24 87,14 98,21
01/07/2011 144,83 93,42 86,23 100,57
01/08/2011 140,45 93,81 86,15 98,95
01/09/2011 166,69 95,38 89,78 99,3
01/10/2011 138,77 95,91 87,95 101,57
01/11/2011 164,42 96,13 90,56 104,76
01/12/2011 147,8 94,85 88,17 99,43
01/01/2012 142,08 96,22 88,74 98,02
01/02/2012 148,76 95,74 88,98 99,26
01/03/2012 138,32 96,41 88,58 98,81
01/04/2012 130,13 97,23 88,44 100,15
01/05/2012 148,26 96,3 89,56 99,07
01/06/2012 139,09 96,74 89,08 99,27
01/07/2012 147,07 96,41 89,59 101,18
01/08/2012 139,89 95,43 88,16 100,48
01/09/2012 143,71 95,52 88,59 98,6
01/10/2012 144,87 94,49 87,88 98,07
01/11/2012 76,93 97,55 84,12 98,14
01/12/2012 105,77 98,14 89,29 97,44
01/01/2013 110,1 98,33 89,98 96,9
01/02/2013 124,72 97,25 90,93 101,37
01/03/2013 126,11 97,57 91,34 96,88
01/04/2013 117,26 97,79 90,55 95,77
01/05/2013 121,19 100,05 92,78 96,3
01/06/2013 140,83 97,78 93,25 95,59
01/07/2013 147,7 98,68 94,67 95,71
01/08/2013 150,69 99,45 95,58 93,94
01/09/2013 145,86 99,56 95,21 93,83
01/10/2013 123,04 99,44 92,88 95,26
01/11/2013 125,26 98,31 92,23 95,27
01/12/2013 129,96 99,35 93,58 98,35
01/01/2014 116,14 99,82 92,46 97,39
01/02/2014 112,75 100,65 92,71 97,06
01/03/2014 118,67 101,05 93,76 98,02
01/04/2014 161 98,79 96,99 96,92
01/05/2014 105,85 100,86 93,73 96,98
01/06/2014 107,89 100,51 93,73 96,43
01/07/2014 114,48 102,25 95,96 96,48
01/08/2014 100,08 100,96 93,12 93,48
01/09/2014 98,67 98,89 91,31 92,31
01/10/2014 110,99 99,04 93,14 91,93
01/11/2014 120,98 99,41 94,69 91,65
01/12/2014 100,72 98,89 91,89 92,84
01/01/2015 86,14 98,79 89,82 90,75
01/02/2015 95,56 99,16 91,58 91,14
01/03/2015 106,77 98,31 92,52 90,5
01/04/2015 78,52 99,25 89,6 89,76
01/05/2015 94,69 99,1 92,25 92,56
01/06/2015 109,12 100,51 95,48 91,86
01/07/2015 109,15 98,69 94,01 91,64
01/08/2015 97,06 101,17 94,45 88,82
01/09/2015 80,65 100,61 91,61 90,74
01/10/2015 94,85 99,78 93,39 90,89
01/11/2015 94,74 98,67 92,5 93,48
01/12/2015 77,41 99,14 90,33 87,75
01/01/2016 78,59 98,31 89,89 85,93
01/02/2016 73,8 98,83 89,48 84,6
01/03/2016 62,92 98,26 87,06 82,98
01/04/2016 70,72 99,04 89,26 83,76
01/05/2016 84,59 98,91 91,79 84,32
01/06/2016 85,66 99,87 92,72 87,33
01/07/2016 76,91 97,76 89,63 82,94
01/08/2016 80,6 98,9 91,17 82,78
01/09/2016 96,01 98,86 93,75 85,34
01/10/2016 96,03 100,01 94,69 83,33
01/11/2016 101,63 100,81 96,15 85,67
01/12/2016 85,76 99,91 93,18 87,36
01/01/2017 104,53 100,64 96,81 89,11
01/02/2017 117,8 99,94 98,08 89,2
01/03/2017 99,03 99,56 95,42 87,82
01/04/2017 107,97 98,53 95,87 85,07
01/05/2017 87,54 98,89 93,45 84,81
01/06/2017 67,77 99,19 90,53 81,75
01/07/2017 67,93 98,47 90 82,18
01/08/2017 76,06 98,5 91,64 85
01/09/2017 79,49 99,06 92,7 88,71
01/10/2017 75,91 99,16 92,16 85,73
01/11/2017 76,33 98,36 91,6 87,48
01/12/2017 88,05 98,08 93,49 89,36
01/01/2018 90,06 97,6 93,42 87,6
01/02/2018 84,04 99,14 93,73 87,7
01/03/2018 74,03 98,21 91,31 86,61
01/04/2018 79,26 98,29 92,35 85,5
01/05/2018 87,79 97,65 93,32 88,91
01/06/2018 84,41 97,19 92,41 90,13
01/07/2018 88,39 99,65 95,05 90,52
01/08/2018 83,11 98,62 93,36 91,14
01/09/2018 78,01 98,75 92,61 89,41
01/10/2018 80,64 98,88 93,19 87,89
01/11/2018 54,06 97,45 87,43 87,69
01/12/2018 72,03 97,61 91,91 90,2
01/01/2019 50,7 98,78 88,76 89
01/02/2019 57,45 98,4 90,25 89,15
01/03/2019 68,69 99,5 93,75 91,92
01/04/2019 73,79 99,2 94,56 92,19
01/05/2019 66,16 98,65 92,64 92,53
01/06/2019 72,85 97,98 93,52 92,59
01/07/2019 75,07 98,67 94,5 94,2
01/08/2019 82,25 97,96 95,28 94,37
01/09/2019 81,95 97,08 94,5 94,25
01/10/2019 83,12 99,87 97,01 95,23
01/11/2019 95,79 99,41 98,85 96,55
01/12/2019 100 100 100 100
01/01/2020 106,7 98,56 99,78 99,31
01/02/2020 83,86 98,9 96,87 96,97
01/03/2020 116,72 95,31 99,58 96,15

5 Conclusion

Des mesures de l’activité économique agrégée pour les économies sont essentielles pour éclairer les décisions relatives aux politiques fiscales et financières, déterminer les caractéristiques des cycles économiques et examiner la performance économique. Dans cette étude, quatre indices d’activité économique provinciale et territoriale fondés sur différentes approches méthodologiques sont estimés et présentés. Celles-ci reposent sur un modèle simple; l’ACP; une combinaison pondérée des indices simples et de l’ACP; et le LASSO. Dans la plupart des cas, toutes les approches produisent des résultats à peu près semblables. Toutefois, le caractère cyclique et la variance des fluctuations d’un mois à l’autre peuvent être très différents. En règle générale, l’ACP produit la plus grande variabilité et les cycles les plus prononcés, alors que l’indice simple est le plus stable.

Selon les propriétés des méthodologies et de leurs données de sortie, l’indice simple est le plus uniforme entre les provinces et territoires. Il est aussi le plus facile à interpréter en termes de contributions de variables et de justification de l’inclusion de variable. Cependant, les valeurs des paramètres sont souvent non statistiquement significatives et les séries de données d’entrée sont choisies autant pour leur importance économique que pour leur présence dans toutes les provinces et tous les territoires. Par conséquent, ces modèles offrent une approche plus limitée pour l’examen de l’activité économique agrégée, mais ils constituent également une base pour les comparaisons avec des modèles plus complexes.

Les indices fondés sur l’ACP semblent donner une idée plus complète de l’évolution de l’activité au fil du temps, mais on ne sait pas encore comment les principaux éléments devraient être interprétés. À cause de cela, et parce que les indices de l’ACP présentent la plus grande variabilité, ils présentent un compromis entre l’utilisation globale des séries de données d’entrée et l’intelligibilité.

La pondération de l’indice simple et de l’indice ACP produit un résultat qui a une corrélation supérieure avec les fluctuations annuelles du PIB. La combinaison pondérée continue d’avoir plus de variabilité que l’indice simple. Étant donné que l’ACP est incluse, elle n’est pas aussi facile à interpréter que l’indice simple, mais elle fournit probablement une meilleure mesure de l’activité agrégée que ses composantes.

L’indice LASSO obtient de bons résultats en ce qui concerne le PIB réel annuel, mais la configuration du modèle n’est pas aussi adaptée à la situation rencontrée lors de l’estimation des indices d’activité. En particulier, le nombre relativement faible d’observations limite la capacité des algorithmes à effectuer une validation croisée. De plus, bien que les séries de données d’entrée constituent un sous-ensemble distinct de l’ensemble de données d’entrée et que leurs contributions puissent être générées de façon simple et directe, il n’y a aucune raison théorique pour expliquer pourquoi les variables sont importantes, ce qui limite l’intelligibilité du modèle.

Compte tenu des forces et des faiblesses présentes entre l’adéquation des modèles, leur rendement et l’examen de leurs données de sortie, les évaluations effectuées jusqu’à présent suggèrent que les indices simples ou les indices LASSO présentent des résultats liés à un ensemble de données d’entrée fondamentales (souvent fortement influencées par les séries sur l’emploi), que les indices ACP se rapportent davantage à une forme quelconque d’activité à court terme (mais le signal est bruyant) et que l’indice pondéré présente un compromis entre les deux.

Les indices tels qu’ils sont estimés actuellement sont corrélés aux mesures annuelles du PIB réel et aux mesures sous-annuelles du PIB réel pour l’Ontario et le Québec, mais ils ne doivent pas être interprétés comme une mesure du PIB réel. Les indices présentent une plus grande variabilité et un caractère cyclique plus prononcé que les mesures du PIB réel et sont constitués de mesures de la production brute, de l’emploi, de prix relatifs et de ratios importants, comme le taux de chômage. Cela rend les indices appropriés pour comprendre l’activité économique, mais ils ne sont cependant pas équivalents au PIB réel. De plus, les indices ne donnent pas de renseignements sur les différents niveaux d’activité économique entre les provinces et les territoires.

Les indices sont également basés sur un ensemble de données d’entrée et des stratégies de modélisation qui ne sont pas idéales. De nombreuses hypothèses doivent être imposées pour produire les indices, et n’importe laquelle peut s’avérer être une source d’erreurs de mesure importantes. Par conséquent, les indices présentés ici doivent être considérés comme expérimentaux et peuvent être révisés ou remplacés à mesure que les recherches futures améliorent les processus et/ou testent les hypothèses pour déterminer leur validité.

À l’heure actuelle, les corrélations entre les différentes méthodes, leur corrélation positive avec les mesures du PIB réel infra-annuel produites à l’échelon provincial et les comparaisons des propriétés avec la performance économique provinciale et territoriale connue soutiennent leur utilisation en tant qu’indicateurs de cycles économiques, pour comprendre l’ampleur des chocs par rapport à l’histoire d’une province ou d’un territoire ainsi que l’évolution des économies régionales. Les comparaisons interprovinciales sont également soutenues, mais avec la mise en garde que l’efficacité du modèle est difficile à comprendre dans toutes les situations et que les comparaisons à divers niveaux entre les provinces ne sont pas possibles à partir des valeurs d’indice.

Références

Brave, Scott, et R. Andrew Butters. 2010. « Chicago Fed National Activity Index Turns Ten—Analyzing Its First Decade of Performance. » Chicago Fed Letter, no 273 (avril). Federal Reserve Bank of Chicago. https://www.chicagofed.org/~/media/publications/chicago-fed-letter/2010/cflapril2010-273-pdf.pdf.

Statistique Canada. 2020a. « Produit intérieur brut (PIB) aux prix de base, par industries, mensuel (36 100 434). » Statistique Canada. Statistique Canada, le 24 janvier 2020. https://www150.statcan.gc.ca/n1/pub/13-607-x/2016001/230-fra.htm (consulté le 2 juin 2020)

Statistique Canada. 2020b. « Produit intérieur brut (PIB) aux prix de base, par industries, mensuel (36 100 434). » Statistique Canada. Statistique Canada, le 31 juillet 2019. https://www.statcan.gc.ca/fra/programmes-statistiques/document/1301_D1_V3 (consulté le 2 juin 2020)

Federal Reserve Board of Chicago. 2020. « Chicago Fed National Activity Index (CFNAI) Current Data. » Federal Reserve Board of Chicago, 22 juin 2020. https://www.chicagofed.org/research/data/cfnai/current-data (consulté le 2 juin 2020).

Evans, Liu, Charles L. et Genevieve Pham-Kanter. 2002. « The 2001 Recession and the Chicago Fed National Activity Index: Identifying Business Cycle Turning Points. » Economic Perspectives 26 (3). Federal Reserve Bank of Chicago : p. 26 à 43. https://www.chicagofed.org/~/media/publications/economic-perspectives/2002/3qepart2-pdf.pdf.

Hyndman, R.J., et Athanasopoulos, G. 2018. Forecasting: principles and practice, 2e édition, OTexts : Melbourne, Australie. OTexts.com/fpp2. Consulté le 2 juin 2020.

Jolliffe, I.T. 2002. Principle Components Analysis Second Edition. Springer-Verlag New York Inc., New York, NY.

Nations Unies (ONU), Commission européenne (CE). Fonds monétaire international (FMI), Organisation de coopération et de développement économiques (OCDE) et Banque mondiale (BM). 2009. Système de comptabilité nationale, 2008. New York : Nations Unies. Disponible à : https://unstats.un.org/unsd/nationalaccount/docs/SNA2008FR.pdf (consulté le 2 juin 2020).

Organisation de coopération et de développement économiques (OCDE). 2008. Handbook on Constructing Composite Indicators Methodology and User Guide. Organisation de développement économique. https://www.oecd.org/sdd/42495745.pdf (consulté le 2 juin 2020).

Tibshirani, Robert. 1996. « Regularization Shrinkage and Selection via the Lasso. » Journal of Royal Statistical Society: Series B.

Zou, Hui et Trevor Hastie. 2005. « Regularization and Variable Selection via the Elastic Net. » Journal of Royal Statistical Society: Series B (Statistical Methodology) 67 (2): 301–20. doi:10.1111/j.1467-9868.2005.00503.x.

Date de modification :