Études analytiques : méthodes et références
Indices expérimentaux de l’activité économique des provinces et territoires au Canada : mesures expérimentales fondées sur des combinaisons de séries chronologiques mensuelles

par Nada Habli, Ryan Macdonald et Jesse Tweedle
Division de l’analyse économique, Statistique Canada N^o 027

Date de diffusion : le 19 août 2020

Renseignements supplémentaires Version PDF

Passer au texte

Début du texte

Remerciements

Les auteurs tiennent à remercier Étienne Saint-Pierre, Yvan Clermont, Danny Leung et Brenda Bugge pour leur soutien et leurs conseils tout au long du projet. Ils aimeraient aussi remercier Steve Matthews, Fred Picard et Michel Ferland pour leurs commentaires et leurs contributions sur la modélisation. Ils souhaitent également remercier Philip Smith et Karen Wilson pour leurs conseils, leurs suggestions et leur soutien.

Résumé

Le présent document porte sur les méthodes de création d’un indicateur mensuel de l’activité économique pour les provinces et les territoires. Il commence par la création d’un ensemble de données pour les provinces et les territoires, composé de séries mensuelles sur : la population active, y compris les salaires et l’emploi; le commerce international; les mesures de production telles que les ventes du secteur de la fabrication ou la production d’électricité; et les prix (consommation, logement et électricité). Lorsque cela est nécessaire, les séries sont désaisonnalisées, couplées et déflatées pour créer des séries chronologiques continues allant de janvier 2002 à avril 2020. Des méthodes de réduction des variables sont ensuite appliquées à l’ensemble de données provincial et territorial mensuel pour créer les indices expérimentaux mensuels de l’activité économique des provinces et territoires. Trois méthodes sont examinées : l’analyse en composantes principales (ACP), la moindre contraction absolue et opérateur de sélection (LASSO) et un indice simple composé de trois séries prédéterminées (emploi total, exportations totales et ventes au détail). Une moyenne pondérée de l’indice simple et de l’indice ACP est également calculée. En général, les indices produits donnent une assez bonne image de l’activité économique provinciale, suivant les mouvements cycliques des économies provinciales et territoriales. Toutefois, la configuration pour les modèles n’est pas idéale, car des données annuelles sont utilisées pour produire les paramètres des modèles, ce qui crée de l’incertitude quant au rendement du modèle. Par conséquent, plusieurs indices sont fournis. Une évaluation de la qualité donne une indication des forces et des limites des indices en ce qui concerne les différentes utilisations.

1 Introduction

Des mesures actuelles de l’activité économique sont essentielles pour comprendre le rendement des économies, et pour orienter les réponses stratégiques aux fluctuations macroéconomiques. Le début de la pandémie attribuable à l’émergence du virus SRAS-CoV-2 a mis l’accent sur ce point, ainsi que sur la nécessité de mesures spécifiques à la région géographique. À l’heure actuelle, le Canada dispose d’un solide système de production de mesures d’activité à jour, comme le produit intérieur brut (PIB) réel, au niveau national. En ce qui concerne les économies provinciales et territoriales, des renseignements mensuels sur les marchés du travail ou sur des activités particulières comme la fabrication ou le commerce international sont disponibles, mais on ne dispose pas d’une mesure mensuelle de l’activité économique agrégée.

Dans des circonstances normales, la production d’un nouvel ensemble d’indicateurs économiques agrégés pour les provinces et les territoires exigerait la création de mesures exploratoires, et demanderait peut-être le lancement de nouvelles enquêtes ou l’expansion des activités de collecte de statistiques existantes, ainsi que la création de l’infrastructure nécessaire à la production et à la diffusion des indicateurs de manière continue. La mise en œuvre de ces modifications nécessite du temps. Dans le contexte actuel, où la pandémie du SRAS-CoV-2 accentue les besoins en indicateurs économiques régionaux mensuels, le temps nécessaire pour mettre sur pied un nouveau programme statistique afin de répondre aux exigences actuelles signifie que cette approche est irréalisable.

Une approche plus rapide consiste à adopter une stratégie fondée sur des modèles statistiques afin de créer rapidement des mesures exploratoires pour l’activité économique provinciale. Bien que cette approche introduise une nouvelle mesure de l’activité économique en temps opportun, le compromis est que les méthodes employées ne sont pas utilisées dans les situations pour lesquelles elles sont idéales, que les entrées pour les modèles utilisent des séries actuellement disponibles sans pouvoir adapter leurs utilisations à la création d’un indicateur, et que les modèles reposent peu sur la théorie. Autrement dit, les modèles recherchent des corrélations dans les données plutôt que d’utiliser la théorie économique pour guider leur construction. Enfin, les modèles employés ici ont généralement un ensemble différent d’intrants pour chaque province ou territoire. Par conséquent, l’uniformité des structures du modèle ne peut être maintenue pour chaque province et territoire, ce qui peut avoir une incidence sur les comparaisons entre les secteurs de compétence^Note.

Pour estimer les indices de l’activité, une stratégie à deux volets est appliquée. En premier lieu, un ensemble de données de panel équilibré composé de séries chronologiques provinciales et territoriales mensuelles est constitué à partir de tableaux de l’Entrepôt commun de données de sortie (ECDS) qui sont accessibles au public. Cet ensemble de données s’étend de janvier 2002 aux plus récents points de données disponibles (actuellement avril 2020). Deuxièmement, trois méthodes sont appliquées à l’ensemble de données pour transformer la série mensuelle en un indicateur de l’activité économique provinciale et territoriale : un modèle simple, l’analyse en composantes principales (ACP) et la moindre contraction absolue et opérateur de sélection (LASSO). Un quatrième indice qui combine l’indice du modèle simple et l’indice basé sur l’ACP est également produit. Les résultats de ces approches forment les mesures exploratoires de l’activité économique provinciale agrégée qui sont présentées ici.

Les indices expérimentaux sont basés sur l’utilisation de modèles statistiques avec un ensemble de données d’entrée qui contient une série d’approximations et d’hypothèses. Parmi les hypothèses pour l’ensemble de données d’entrée, on compte notamment : l’utilisation de déflateurs nationaux pour produire de vraies séries provinciales lorsque les déflateurs provinciaux n’existent pas, l’hypothèse que les taux de croissance pour toutes les séries sont stationnaires en matière de covariance, et l’hypothèse que la winsorisation des données aux 5^e et 95^e percentiles est appropriée.

Pour les modèles, la croissance annuelle du PIB réel dans l’ensemble des provinces et des territoires sert de mesure de l’activité provinciale agrégée par rapport à laquelle les mesures dérivées de l’indice de l’activité économique sont comparées. Il en résulte une situation où un petit nombre d’observations annuelles sont utilisées pour estimer les paramètres du modèle qui sont utilisés pour déduire les fluctuations mensuelles. Le petit nombre d’observations a une incidence sur la capacité des modèles à fournir des inférences suffisantes, et l’utilisation de données annuelles peut masquer d’importantes différences dans le calendrier mensuel des variations des prix, de la production et de l’emploi.

Afin de permettre la possibilité que l’utilisation des données annuelles puisse avoir une incidence sur le rendement et l’inférence du modèle, le modèle simple suppose qu’un ensemble de variables est approprié et utilise les moindres carrés ordinaires (MCO) pour déterminer leur contribution relative. Dans le cas de l’ACP, on utilise un R carré ajusté et maximisé à partir des régressions par MCO pour choisir lesquels des 10 premiers composants principaux doivent être inclus. Dans ces deux situations, les régressions par MCO incluent des variables qui sont statistiquement non significatives. Pour le LASSO, la signification statistique des variables d’entrée potentielles détermine le modèle final. Toutefois, en ce qui concerne le LASSO, pour certaines économies, aucune variable d’entrée n’est sélectionnée. Dans ces cas, on utilise plutôt la méthode elastic-net ou une stratégie de modélisation générale à spécifique.

Comme l’ensemble de données d’entrée contient un certain nombre d’hypothèses et d’approximations et que les modèles statistiques sont utilisés dans un contexte imparfait, les indices expérimentaux qui sont créés doivent être considérés comme des approximations de l’activité économique agrégée plutôt que comme des mesures exactes. Les indices d’activité ont tendance à présenter une volatilité mensuelle considérable, et lorsqu’on les compare aux estimations du PIB réel produites par le gouvernement du Québec ou le gouvernement de l’Ontario, ils peuvent montrer une plus grande volatilité cyclique.

Dans l’ensemble des mesures, les modèles simples et les modèles LASSO tendent à s’appuyer davantage sur les séries d’emplois comme données d’entrée. L’indice simple a l’avantage d’être facile à comprendre et est le plus comparable pour toutes les provinces et tous les territoires puisqu’il maintient la constante des variables utilisées dans l’indice d’activité, peu importe la province ou le territoire. Les indices de l’ACP semblent saisir davantage de fluctuations liées à d’autres aspects de l’activité globale (p. ex. ventes ou exportations), mais ils présentent aussi une plus grande variabilité. La combinaison pondérée des indices simples définis par les chercheurs et des indices ACP a une meilleure corrélation avec la croissance du PIB réel que les indices constitutifs.

À l’heure actuelle, les indices pondérés ou les indices basés sur le LASSO semblent offrir le meilleur compromis entre les signaux présents dans les données et la variabilité des séries mensuelles. Cette évaluation est fondée sur la mesure dans laquelle les modèles semblent se conformer à la configuration utilisée pour l’estimation ainsi qu’au comportement des indices. Dans certains cas, comme l’indice fondé sur l’ACP pour Terre-Neuve-et-Labrador, il y a une anomalie qui remet en question la véracité de l’indice. Lorsque ce genre de situation se produit, les données sont considérées comme impropres à l’utilisation à l’heure actuelle, et les estimations pour cet indice ne sont pas fournies. Les évaluations sont en cours et peuvent entraîner des changements dans les utilisations ou les indices recommandés, à mesure que l’on étudie la possibilité d’élaborer davantage l’ensemble de données d’entrée, d’affiner les modèles ou d’autres stratégies de modèles.

Le reste du présent document est structuré comme suit. La section 2 traite de la création de l’ensemble de données d’entrée ainsi que des hypothèses utilisées pour filtrer et transformer les données avant la modélisation. La section 3 décrit les modèles employés, les hypothèses intégrées aux modèles, ainsi que leurs forces, leurs limites et leur application pour créer des indices mensuels. La section 4 présente une analyse du rendement du modèle et illustre les indices qui en résultent. La section 5 présente la conclusion.

2 Ensemble de données d’entrée

L’ensemble de données d’entrée est composé de mesures propres à une province ou à un territoire pour l’activité économique et les déflateurs économiques au niveau du Canada, sauf dans les cas où des déflateurs propres à une province ou à un territoire sont disponibles. Les séries mensuelles de données d’entrée sont composées d’enquêtes mensuelles sur la main-d’œuvre, les produits et les prix (tableau 1). Dans certains cas, les tableaux actifs ne contiennent pas de renseignements continus allant de janvier 2002 à ce jour. Dans ce cas, les tableaux historiques sont utilisés pour rétropoler les tableaux actifs.

Tableau 1
Tableaux des données d’entrée des séries chronologiques provinciales et territoriales
Sommaire du tableau
Le tableau montre les résultats de Tableaux des données d’entrée des séries chronologiques provinciales et territoriales. Les données sont présentées selon Numéro de tableau (titres de rangée) et Titre du tableau(figurant comme en-tête de colonne).
Numéro de tableau	Titre du tableau
12100099	Importations et exportations de marchandises, base douanière, selon le Système harmonisé de désignation et de codification des marchandises (SH), Canada, provinces et territoires, États-Unis, États
12100119	Commerce international de marchandises par province, produit et principaux partenaires commerciaux
14100036	Heures effectivement travaillées selon l’industrie, données mensuelles non désaisonnalisées
14100201	Emploi selon l’industrie, données mensuelles non désaisonnalisées
14100222	Emploi, rémunération horaire et hebdomadaire moyenne (incluant les heures supplémentaires) et heures hebdomadaires moyennes pour l’ensemble des industries excluant les entreprises non classifiées, données mensuelles désaisonnalisées
14100287	Caractéristiques de la population active, données mensuelles désaisonnalisées et tendance-cycle, cinq derniers mois
14100292	Caractéristiques de la population active selon le territoire, moyennes mobiles de trois mois, données désaisonnalisées et non désaisonnalisées, 5 derniers mois
14100355	Emploi selon l’industrie, données mensuelles désaisonnalisées et non désaisonnalisées, et tendance-cycle, cinq derniers mois
16100048	Ventes pour les industries manufacturières selon l’industrie et province, données mensuelles (dollars sauf indication contraire)
18100004	Indice des prix à la consommation mensuel, non désaisonnalisé
18100204	Indice des prix de vente de l’énergie électrique, mensuel
18100205	Indice des prix des logements neufs, mensuel
20100008	Ventes de commerce de détail par province et territoire
20100074	Commerce de gros, ventes
21100019	Enquête mensuelle sur les services de restauration et les débits de boissons
24100002	Nombre de véhicules voyageant entre le Canada et les États-Unis
25100001	Statistiques de l’énergie électrique, avec des données pour les années 1950 à 2007
25100015	Production de l’énergie électrique, production mensuelle selon le type d’électricité
34100003	Permis de bâtir, valeur selon le secteur d’activité
34100066	Permis de bâtir, par type de structure et type de travaux
34100158	Société canadienne d’hypothèques et de logement, logements mis en chantier, toutes les régions, pour Canada et les provinces, désaisonnalisées au taux annuel, mensuel
Note : SH : Système harmonisé. Source : Statistique Canada, compilation des auteurs.

Les déflateurs sont principalement recueillis dans le cadre de programmes d’enquête au niveau du Canada pour les mesures de l’activité économique (tableau 2). À l’heure actuelle, Statistique Canada ne produit pas de déflateurs propres aux provinces et aux territoires pour les mesures en dollars courants du commerce international, des ventes du secteur de la fabrication, des ventes en gros, des ventes au détail ou de l’Enquête mensuelle sur les services de restauration. Pour recueillir les déflateurs, les indices de prix au niveau du Canada sont tirés d’enquêtes lorsqu’ils sont disponibles. Dans le cas de la fabrication, l’indice implicite de prix est calculé en tant que ratio entre la valeur nominale et la valeur réelle. Il existe des déflateurs pour les séries nominales depuis janvier 2002, sauf pour la fabrication. Pour la fabrication, l’Indice des prix des produits industriels (IPPI) par industrie, l’IPPI par groupe de produits et le ratio entre le PIB nominal et le PIB mensuel réel sont utilisés comme base de projection pour les déflateurs de l’industrie manufacturière.

Tableau 2
Tableaux de données pour les séries chronologiques des déflateurs
Sommaire du tableau
Le tableau montre les résultats de Tableaux de données pour les séries chronologiques des déflateurs. Les données sont présentées selon Numéro de tableau (titres de rangée) et Titre du tableau(figurant comme en-tête de colonne).
Numéro de tableau	Titre du tableau
12100128	Commerce international de marchandises par classification des produits, indices de prix et de volume, mensuel
16100013	Valeur réelle des ventes, des commandes, des stocks possédés et le ratio des stocks aux ventes des industries manufacturières, en dollars de 2012, désaisonnalisées
16100047	Stocks, ventes, commandes et rapport des stocks sur les ventes pour les industries manufacturières, selon l’industrie (dollars sauf indication contraire)
18100004	Indice des prix à la consommation mensuel, non désaisonnalisé
18100029	Indice des prix des produits industriels, par principaux groupes de produits, mensuel
18100032	Indice des prix des produits industriels, par industrie, mensuel
20100003	Ventes de grossistes, prix et volume, selon l’industrie, désaisonnalisées
20100038	Commerce de détail, ventes, dollars enchaînés et indices de prix, inactif
20100051	Commerce de gros, ventes, dollars enchaînés et indices de prix, inactif
20100078	Ventes au détail, prix et volume, désaisonnalisé
36100434	Produit intérieur brut (PIB) aux prix de base, par industriel, mensuel
Note : SH : Système harmonisé. Source : Statistique Canada, compilation des auteurs.

Pour combiner les données provinciales et les données des déflateurs afin de créer l’ensemble de données d’entrée, il y a quatre étapes :

Assembler les données. Les tableaux de l’ECDS sont filtrés pour sélectionner les données désirées. Seules les variables avec des données continues sont sélectionnées. Les séries pouvant faire l’objet de suppression sont exclues, mais les séries comportant des valeurs nulles sont incluses. Les séries pouvant faire l’objet de suppression sont généralement des séries aux valeurs plus petites, ce qui signifie qu’elles contiennent moins de renseignements sur les fluctuations économiques agrégées. Bien qu’il existe des méthodes pour interpoler ces points de données, si la suppression se produit au cours du dernier mois, une prévision serait nécessaire pour remplir le point de données supprimé. Étant donné que l’indice est en cours de construction pour fournir des renseignements sur le plus grand choc ayant frappé l’économie canadienne depuis la Seconde Guerre mondiale, on juge qu’il n’est pas souhaitable d’inclure des séries comportant des valeurs prévues.
Désaisonnaliser les séries de données. Ce ne sont pas toutes les séries qui sont fournies sur une base désaisonnalisée. Il y a au total 966 séries qui sont désaisonnalisées pour être utilisées dans l’indicateur. Étant donné le nombre élevé de séries, les options automatiques de l’algorithme ARIMA-SEATS du progiciel R relatif à la saisonnalité sont utilisées pour supprimer la saisonnalité. Les paramètres saisonniers sont déterminés en fonction des séries chronologiques mensuelles disponibles jusqu’en décembre 2019. Dans le cas où les séries chronologiques ne couvrent pas toute la période, comme les séries interrompues, les données jusqu’à la période la plus récente sont utilisées pour déterminer les options de désaisonnalisation.

Afin de s’assurer que les séries désaisonnalisées sont de bonne qualité, elles ont été validées par diverses mesures de qualité. Cela inclut notamment vérifier la présence de saisonnalité, la quantité de saisonnalité stable présente par rapport à la quantité de saisonnalité évolutive (M7), l’absence d’effets saisonniers dans la composante irrégulière, l’uniformité de la série désaisonnalisée par rapport à sa forme brute et de contrôler le nombre de valeurs aberrantes détectées automatiquement par ARIMA-SEATS jusqu’à un maximum de cinq. Les séries qui se sont avérées non saisonnières (125 séries) sont conservées sous leur forme brute. Les séries désaisonnalisées dont la qualité est médiocre (183 séries) sont éliminées de l’ensemble de données avant l’estimation.

Coupler les données. Après la désaisonnalisation, les données sont couplées au besoin. Lorsqu’il existe des périodes de chevauchement, des liens sont établis en traitant les données comme des indices et en les enchaînant rétrospectivement sur les périodes historiques. S’il n’existe pas de périodes de chevauchement, les valeurs de niveau sont jointes « telles quelles ».
Appliquer les déflateurs. Si nécessaire, des déflateurs sont appliqués aux séries en dollars courants ou aux séries de prix pour produire des variables relatives des prix.

L’ensemble de données complet avant le filtrage contient des séries désaisonnalisées et non désaisonnalisées, des séries nominales et des séries déflatées propres à la province et au territoire. Pour modéliser l’activité économique provinciale et territoriale, des séries en unités naturelles (p. ex. employés, heures travaillées), des séries déflatées, des taux (p. ex. le taux de chômage) et les prix relatifs sont sélectionnés.

3 Estimation

L’objectif est d’estimer les séries chronologiques mensuelles pour l’activité économique agrégée dans les provinces et les territoires en tant que fonction des séries chronologiques économiques mensuelles provinciales et territoriales disponibles :

y_{m e n s u e l, t} = f (m e n s u e l / p é r i o d e / s é r i e)

La mesure la plus couramment citée de l’activité économique agrégée est la mesure du PIB réel décrite dans le Système de comptabilité nationale de 2008 (Nations Unies, 2010)^Note. Au niveau de l’ensemble du Canada, la fonction pour la transformation des séries de données d’entrée en PIB réel mensuel est fondée sur des méthodologies et des points de repère propres à l’industrie qui ont été élaborés et enrichis au fil du temps. Les méthodologies utilisent diverses sources de données pour estimer les variations de la production brute qui servent d’approximation pour le PIB réel. Les approximations sont combinées à des points de repère annuels du PIB réel pour produire la série mensuelle du PIB réel. Dans de nombreux cas, une mesure directe de la production brute est disponible. Toutefois, dans certaines industries, aucune mesure directe de la production n’est disponible et les estimations sont produites au moyen d’autres sources de données, comme l’emploi (Statistique Canada, 2020b)^Note. Cette méthodologie forme la fonction $f (.)$ dans laquelle les séries mensuelles sont placées pour produire le PIB réel mensuel du Canada.

La difficulté en ce qui concerne mesurer l’activité économique agrégée des provinces et des territoires est le fait que la fonction $f (.)$ pour les provinces et les territoires est inconnue et que la série désirée, $y_{m e n s u e l, t}$ est également inconnue.

Puisque le but est d’estimer $y_{m e n s u e l, t}$ , si un proche substitut existait, il pourrait servir d’instrument pour le vrai $y_{m e n s u e l, t}$ . La fonction $f (.)$ pour combiner des renseignements mensuels afin de produire une mesure agrégée de l’activité économique pourrait alors être approximative. Bien qu’il n’existe aucun substitut mensuel proche pour $y_{m e n s u e l, t}$ , le Système canadien des comptes macroéconomiques produit une mesure du PIB provincial et territorial à une fréquence annuelle. L’approche adoptée ici suppose donc que les données annuelles peuvent servir d’instrument pour aider à éclairer la structure de $f (.)$ lorsque la moyenne des taux de croissance mensuels de la série d’entrées disponibles est calculée pour une année civile et utilisée pour estimer les valeurs des paramètres. Les paramètres de $f (.)$ et les caractéristiques de variance de la série d’entrées mensuelles sont ensuite ajustées pour tenir compte de la différence de périodicité. Les indices mensuels de l’activité économique agrégée sont alors élaborés à partir des valeurs mensuelles estimées de $y_{m e n s u e l, t}$ .

L’utilisation d’une variable de fréquence plus basse comme instrument pour l’activité économique mensuelle réduit le nombre de degrés de liberté et introduit des problèmes liés au rythme des fluctuations mensuelles par rapport aux fluctuations annuelles. Ces problèmes auront des conséquences sur la capacité des modèles à produire une estimation mensuelle de l’activité économique agrégée. Les petits degrés de liberté et la covariance autour de la récession de 2008 auront tendance à produire des paramètres non statistiquement significatifs pour $f (.)$ , si les variables explicatives ne sont pas touchées de façon importante par les fluctuations du cycle économique. En outre, les modèles peuvent avoir tendance à sélectionner un nombre plus faible d’entrées à une fréquence annuelle qu’il n’est nécessaire pour expliquer la variation mensuelle, car d’importantes fluctuations mensuelles peuvent être masquées par une agrégation à une fréquence plus faible. De plus, les changements liés aux prix, aux ventes/à la production et à l’emploi se produiront simultanément à une fréquence annuelle. Toutefois, à une fréquence mensuelle, ces fluctuations peuvent ne pas s’aligner.

Étant donné qu’une conversion de la fréquence annuelle à une fréquence mensuelle est nécessaire pour générer les valeurs estimées désirées, la stratégie de modélisation comprend certaines approches qui préfèrent capturer davantage de variation dans les données plutôt que de se concentrer uniquement sur la parcimonie des modèles. Cela ne veut pas dire que les modèles sont produits de manière ponctuelle. Au contraire, les critères de sélection, comme la maximisation d’un R carré ajusté, sont utilisés en parallèle avec des stratégies de modélisation de type général ou spécifique plus traditionnelles.

En résumé, parce que la forme fonctionnelle pour la transformation des données mensuelles en mesures agrégées de l’activité économique est inconnue, et parce que les valeurs réelles de la série $y_{m e n s u e l, t}$ sont également inconnues, la meilleure chose possible est d’approcher le vrai $y_{m e n s u e l, t}$ . Cela signifie que la série ${\hat{y}}_{m e n s u e l, t}$ ressemblera fortement à une série sur le PIB réel, mais ne sera pas une véritable mesure du PIB mensuel réel. Elle sera plutôt une estimation de l’indice d’activité économique qui correspond aux conditions macroéconomiques dans les provinces et les territoires.

3.1 Stratégie d’estimation

La fonction $f (.)$ est un ensemble d’instructions pour transformer un grand nombre de données d’entrée en une seule série. Dans cet article, on suppose que la fonction peut être basée de façon approximative sur une combinaison linéaire d’entrées et que les entrées peuvent être sélectionnées soit en sélectionnant un sous-ensemble des données disponibles, soit en créant une combinaison de toutes les séries de données d’entrée. Ci-dessous, trois approches sont explorées : 1) un modèle simple; 2) l’ACP; et 3) le LASSO. Le modèle simple et le modèle LASSO relèvent de la première catégorie, tandis que l’ACP appartient à la deuxième catégorie.

Les hypothèses et la mise en œuvre des modèles sont examinées en détail ci-après. Dans toutes les stratégies de modélisation, les étapes suivantes sont suivies pour estimer les valeurs des indices dans tous les cas :

1 : Préparer les données d’entrée.

L’ensemble de données d’entrée comporte 1 341 séries qui sont distribuées inégalement à travers les provinces et les territoires (tableau 3). Toutes les séries n’ont pas la même utilité pour modéliser l’activité économique agrégée. Dans les cas où la désaisonnalisation a échoué, les séries sont supprimées. De même, les séries comportant des valeurs nulles sont supprimées. Ces séries ont tendance à être des séries où les valeurs nulles sont entrecoupées par des valeurs nominales. Dans ces cas, les valeurs désaisonnalisées peuvent être négatives, le taux de croissance ou les transformations des différences logarithmiques peuvent ne pas fonctionner, et les séries ont une valeur douteuse en ce qui concerne leur utilité comme indicateur permanent de l’activité économique. Dans l’ensemble, 198 variables sont abandonnées pour ces raisons.

Tableau 3
Nombre de variables d’entrée
Sommaire du tableau
Le tableau montre les résultats de Nombre de variables d’entrée. Les données sont présentées selon (titres de rangée) et Vecteurs de départ, Avec 0, Échec de la DS, Non renouvelé, 15 principaux vecteurs, 25 principaux vecteurs, Vecteurs pour le LASSO et Vecteurs pour l’ACP(figurant comme en-tête de colonne).
	Vecteurs de départ	Avec 0	Échec de la DS	Non renouvelé	15 principaux vecteurs	25 principaux vecteurs	Vecteurs pour le LASSO	Vecteurs pour l’ACP
Terre-Neuve-et-Labrador	108	3	8	8	15	25	83	73
Île-du-Prince-Édouard	101	12	15	20	12	20	65	57
Nouvelle-Écosse	115	2	14	14	15	25	84	74
Nouveau-Brunswick	115	1	12	13	15	24	81	72
Québec	131	1	10	11	18	29	97	86
Ontario	133	0	11	11	18	30	99	87
Manitoba	120	1	6	6	17	28	94	83
Saskatchewan	118	0	11	11	16	26	85	75
Alberta	122	0	8	8	17	27	91	81
Colombie-Britannique	122	0	8	8	17	28	92	81
Yukon	63	22	20	26	6	10	31	27
Territoires du Nord-Ouest	59	27	29	31	5	7	23	21
Nunavut	46	29	29	32	2	4	11	9
Total	1 353	98	181	199	173	283	936	826
Note : LASSO : moindre contraction absolue et opérateur de sélection; ACP : analyse en composantes principales; DS : désaisonnalisation. Source : Statistique Canada, compilation des auteurs.

L’ensemble de données d’entrée filtré contient alors 1 143 séries. Cependant, les séries sont généralement rapportées en niveaux (p. ex. heures travaillées ou ventes manufacturières en dollars enchaînés) et présentent de fortes tendances au cours de la période d’échantillonnage. Pour tenir compte des tendances, les séries sont transformées en taux de croissance d’un mois à l’autre. Ces taux de croissance seront finalement comparés aux mesures de la croissance du PIB réel, et ils ont l’avantage d’être liés par -100 % pour le déclin maximum^Note. Les taux de croissance pour la série sont censés être stationnaires en matière de covariance.

Pour utiliser la série dans l’estimation, toutes les séries sont centrées et mises à l’échelle pour avoir une variance au niveau des unités à une fréquence mensuelle. Ce processus de normalisation est appliqué aux variables afin d’éviter que des variables dont les valeurs unitaires sont naturellement plus élevées n’affectent les résultats. Étant donné que les séries chronologiques mensuelles peuvent avoir une forte variabilité, et parce que les périodes de chocs économiques comme les récessions peuvent produire des points de données aberrants, toutes les séries sont « winsorisées » (ou tronquées des valeurs extrêmes supérieures et inférieures) avant l’estimation. Cela empêche les points de données extrêmes d’affecter les résultats. Pour créer les indices mensuels, les valeurs des paramètres provenant des modèles basés sur les données obtenues par winsorisation sont combinées avec des données non-winsorisées, ce qui permet aux valeurs plus importantes d’avoir toute leur influence lorsque de grands chocs surviennent.

Enfin, les séries les plus bruyantes sont supprimées. Dans le cas de l’ACP, la tranche supérieure de 25 % des séries selon la variance est éliminée par province, tandis que pour le LASSO, la tranche supérieure de 15 % des séries selon la variance est éliminée. Ces seuils sont arbitraires, mais leur imposition a permis d’améliorer la capacité des modèles d’éclairer sur l’activité agrégée (c.-à-d. améliorer le signal par rapport au bruit) et d’améliorer la cohérence des résultats entre les méthodes. Après ajustement pour les séries à variation élevée, il y a un total de 928 variables d’entrée pour le LASSO et 820 pour l’ACP. Le Nunavut possède le plus petit nombre de séries disponibles, tandis que l’Ontario et le Québec en comptent le plus grand nombre.

2 : En utilisant les taux de croissance winsorisés, calculer la moyenne annuelle des taux de croissance mensuels qui seront utilisés dans les modèles.
3 : Estimer les paramètres du modèle.

Cette estimation est fondée sur la combinaison de la croissance du PIB réel et des moyennes annuelles des séries mensuelles de données d’entrée pour les années 2002 à 2018. La croissance réelle du PIB n’est ni mise à l’échelle ni centrée. En utilisant la croissance réelle du PIB comme variable cible et les moyennes annuelles des séries mensuelles comme variables d’entrée, la forme fonctionnelle de $f (.)$ est estimée. Dans tous les modèles employés, on suppose qu’une combinaison linéaire de variables d’entrée peut être utilisée pour transformer la multiplicité des variables d’entrée en une mesure unique de l’activité agrégée. Dans le cas du modèle simple et du LASSO, un sous-ensemble des variables est utilisé directement. Dans le cas de l’ACP, les 10 premières composantes principales sont utilisées comme point de départ. On présume aussi que les MCO peuvent être utilisés pour générer des contributions permettant de combiner des variables d’entrée. En utilisant des méthodes de régression pour combiner les données d’entrée, on impose une hypothèse supplémentaire comme quoi les structures économiques sont, en moyenne, les mêmes pendant toute la période d’échantillonnage.

4 : Utiliser le modèle pour estimer les taux de croissance mensuels.

Étant donné que toutes les approches peuvent être considérées comme une régression des MCO avec des données d’entrée centrées, l’interception peut être interprétée comme le taux de croissance annuel moyen du PIB réel entre 2002 et 2018. Les données d’entrée sélectionnées (séries chronologiques mensuelles ou composantes principales) produisent des fluctuations pour ce taux de croissance moyen. Pour 2019 et 2020, on suppose que le taux de croissance moyen entre 2002 et 2018 est représentatif de la croissance sous-jacente.

Pour produire des estimations mensuelles, il est nécessaire d’ajuster les estimations des paramètres ou les séries mensuelles pour tenir compte de la différence à l’égard de la périodicité. La constante du modèle est ajustée à une fréquence mensuelle basée sur le taux de croissance mensuel composé qui est équivalent à l’estimation annuelle :

{\hat{β}}_{0, m e n s u e l} = {({\hat{β}}_{0, a n n u e l} + 1)}^{1 / 12} - 1

Pour estimer les fluctuations mensuelles autour du taux de croissance tendanciel, les séries de données d’entrées brutes sont utilisées. Cela permet aux fluctuations importantes dans la série chronologique de présenter toutes leurs répercussions lorsque les chocs économiques, comme les récessions ou les cycles de prix des produits de base, ont des répercussions sur les économies provinciales et territoriales. Les variations des données d’entrée mensuelles sont ajustées pour correspondre à l’écart annuel avant utilisation. Les estimations de régression des MCO sont basées sur le ratio cov(x,y)/var(x). Dans le contexte actuel, l’agrégation au fil du temps réduit la variance de la matrice X. Pour tenir compte de cela, la variance des données mensuelles est rééchelonnée de façon à correspondre à la variance des données annuelles pour chaque série avec l’équation suivante :

σ_{m e n s u e l, a j u s t é} = (\frac{(x - μ_{x})}{σ_{x, m e n s u e l}}) * σ_{x, a n n u e l} + μ_{x}

5 : Générer les indices de niveau

Les valeurs ajustées provenant des modèles sont des estimations de la croissance mensuelle de l’activité économique. Elles peuvent être transformées en indices en ajoutant 1 pour créer une valeur de liaison pour un indice en chaîne. Le niveau de l’indice est ensuite calculé en enchaînant les valeurs à partir de janvier 2002.

Les estimations du taux de croissance sont associées à un intervalle de confiance, car il existe une incertitude quantifiable qui découle du modèle. Il existe également une incertitude non quantifiable qui découle d’une possible erreur de spécification du modèle. Pour produire un indice de niveau, il est nécessaire de supposer que les estimations du taux de croissance sont suffisamment précises pour pouvoir être utilisées pour l’enchaînement, même si les erreurs sont aggravées au fil du temps. Il s’agit là d’une hypothèse solide, mais elle est compatible avec la façon dont les valeurs moyennes des données d’enquête sur les prix, les valeurs et les quantités sont combinées pour produire des indices de quantité enchaînée ou de prix enchaînés.

L’utilisation de plusieurs modèles à l’étape 3 conduira finalement à la présentation de différents types de l’indice d’activité. Dans le contexte actuel, où les modèles statistiques sont utilisés pour donner des renseignements sur l’activité économique dans un environnement où ils ne peuvent être mis en œuvre de manière optimale, la création de plusieurs versions de l’indice de l’activité joue un rôle important. Parce que la vraie valeur pour $y_{m e n s u e l, t}$ inconnue, valider $\hat{f (.)}$ et ${\hat{y}}_{m e n s u e l, t}$ est difficile. Les données de sortie des différentes méthodes fournissent une forme naturelle de confrontation des données qui aide à évaluer l’acceptabilité et la généralisation des estimations.

3.1.1 Modèle simple

Le modèle simple part du principe que l’emploi total, les exportations totales et les ventes totales au détail contiennent les renseignements appropriés pour comprendre les fluctuations économiques agrégées. Cette hypothèse est probablement trop hardie, car plus de trois données d’entrée sont nécessaires pour saisir pleinement les complexités de l’activité économique agrégée. Toutefois, le modèle est cohérent dans l’ensemble des provinces et des territoires, et il est facile de le comprendre. Il est donc utile en tant que base contre laquelle des méthodes plus complexes peuvent être évaluées. L’approche simple représente également une méthode qui peut être considérée comme compatible avec les types de bases de projection utilisées pour déduire les mouvements de la production brute qui sont utilisés comme données d’entrée pour le PIB mensuel du Canada (Statistique Canada, 2020b).

Comme les séries n’ont pas de structure naturelle d’agrégation pour les combiner, les régressions sont utilisées pour déterminer les contributions relatives des variables plutôt qu’une formule de calcul de l’indice. Étant donné que les données d’entrée sont censées être les données d’entrée nécessaires, les trois séries sont incluses indépendamment de leur importance statistique en matière de régressions.

3.1.2 Analyse des composantes principales

L’ACP est une technique de réduction variable qui vise à expliquer la variance d’un ensemble de données particulier en utilisant un plus petit nombre de composantes principales (OCDE 2008, Jollife 2002). Un ensemble de données avec des variables p $X = [x_{1}, x_{1}, ..., x_{p}]$ , peut être transformé pour produire les composantes principales p :

Z = A X

où

z_{1} = a_{1, 1} x_{1} + a_{1, 2} x_{2} + .. + a_{1, p} x_{p}

z_{2} = a_{2, 1} x_{1} + a_{2, 2} x_{2} + .. + a_{2, p} x_{p}

z_{p} = a_{p, 1} x_{1} + a_{p, 2} x_{2} + .. + a_{p, p} x_{p}

Les composantes principales sont calculées comme des combinaisons linéaires des variables d’entrée (la série mensuelle). La première composante principale explique la plus importante proportion de la variance des variables d’entrée. C’est le vecteur propre associé à la plus grande valeur propre. La deuxième composante principale est orthogonale (sans corrélation) avec la première composante principale et est le vecteur propre associé à la deuxième plus grande valeur propre. Elle explique la deuxième composante la plus importante des variables d’entrée. On peut donc dire qu’elle mesure une différente dimension statistique des séries disponibles. La troisième composante principale est orthogonale aux deux premières et mesure la troisième plus grande proportion de variance dans les données. Et ainsi de suite jusqu’à la $p^{e}$ composante principale.

Pour mettre en œuvre l’ACP ici, les principales composantes utilisées pour l’estimation du modèle et les chargements sont déterminées en employant la série chronologique mensuelle de la variance winsorisée et centrée au niveau des unités. Les chargements sont ensuite appliqués à la série brute non winsorisée pour produire les composantes principales brutes utilisées pour prédire les taux de croissance mensuels.

Lorsque l’ACP fonctionne bien, une grande partie de la variance d’un ensemble de données peut être expliquée par les premières composantes principales, et seules les premières composantes principales sont utilisées pour l’analyse. Malheureusement, dans le cas de l’ensemble de données d’entrée pour les économies provinciales et territoriales, l’ACP ne fonctionne pas bien pour réduire la portée des renseignements contenus dans l’ensemble de données (tableau 4). La première composante principale représente généralement moins de 10 % de la variation dans l’ensemble de données. De plus, lorsqu’on établit une moyenne pour produire une estimation de la fréquence annuelle, la première composante principale ne correspond pas bien à la croissance annuelle du PIB réel pour la plupart des provinces et des territoires (tableau 5).

Tableau 4
Pourcentage de variation par composante principale
Sommaire du tableau
Le tableau montre les résultats de Pourcentage de variation par composante principale Composantes principales (figurant comme en-tête de colonne).
	1	2	3	4	5	6	7	8	9	10
	Composantes principales
Terre-Neuve-et-Labrador	10,5	16,2	21,0	25,4	29,7	33,3	36,6	39,7	42,6	45,3
Île-du-Prince-Édouard	12,1	19,5	25,7	31,2	35,2	39,1	42,7	46,0	49,2	52,2
Nouvelle-Écosse	9,0	15,2	20,6	24,9	28,5	32,0	35,2	38,3	41,1	43,8
Nouveau-Brunswick	9,6	16,4	21,3	25,8	29,8	33,6	37,3	40,4	43,4	46,3
Québec	7,0	13,0	17,8	21,9	25,5	28,7	31,6	34,3	37,0	39,7
Ontario	8,9	14,6	19,3	23,1	26,4	29,6	32,5	35,3	37,8	40,2
Manitoba	7,9	13,6	19,2	23,8	27,3	30,7	34,0	37,2	39,9	42,6
Saskatchewan	8,6	14,5	19,7	24,4	28,7	32,0	35,1	38,0	40,9	43,6
Alberta	10,5	16,4	21,5	25,9	29,5	33,0	36,1	39,0	41,7	44,3
Colombie-Britannique	8,6	14,7	20,2	25,3	29,4	32,8	35,8	38,6	41,3	44,0
Yukon	14,2	24,8	33,8	39,8	45,1	50,2	54,9	59,3	63,4	67,5
Territoires du Nord-Ouest	17,8	30,6	37,6	44,3	50,3	56,1	61,4	66,6	71,4	76,1
Nunavut	35,8	49,4	62,6	73,6	83,7	92,5	98,1	99,6	100,0	Note ...: n'ayant pas lieu de figurer
... n'ayant pas lieu de figurer Source : Statistique Canada, compilation des auteurs.

Les corrélations indiquent qu’en dehors de l’Alberta, de la Colombie-Britannique et de l’Ontario, le fait d’utiliser uniquement la première composante principale ne produira pas un indice d’activité qui fournit une mesure adéquate pour déterminer le rendement des provinces et des territoires en fonction des fluctuations mensuelles agrégées. Par conséquent, un indice d’activité basé uniquement sur la première composante principale, comme celui produit par le la Federal Reserve Board of Chicago (Federal Reserve Board of Chicago 2020, Brave et Butters 2010, Evans et Pham-Kanter 2002), n’est pas poursuivi ici.

Tableau 5
Corrélation entre la première composante principale et la croissance annuelle du produit intérieur brut (PIB) réel
Sommaire du tableau
Le tableau montre les résultats de Corrélation entre la première composante principale et la croissance annuelle du produit intérieur brut (PIB) réel Indice winsorisé et Indice non winsorisé(figurant comme en-tête de colonne).
	Indice winsorisé	Indice non winsorisé
Terre-Neuve-et-Labrador	-0,349	-0,256
Île-du-Prince-Édouard	-0,199	-0,307
Nouvelle-Écosse	0,531	0,491
Nouveau-Brunswick	-0,709	-0,673
Québec	0,657	0,661
Ontario	0,775	0,778
Manitoba	0,562	0,567
Saskatchewan	0,477	0,338
Alberta	0,937	0,940
Colombie-Britannique	0,840	0,848
Yukon	0,177	0,251
Territoires du Nord-Ouest	0,423	0,422
Nunavut	0,355	0,444
Source : Statistique Canada, compilation des auteurs.

Bien que la première composante principale ait des difficultés à corréler avec les fluctuations annuelles du PIB réel, cela ne signifie pas qu’il n’y a aucun renseignement dans les premières composantes principales pour expliquer la croissance du PIB réel. Par conséquent, pour générer un modèle basé sur les composantes principales, les régressions sont effectuées sur toutes les combinaisons des 10 premières composantes principales en tant que variables explicatives pour expliquer la croissance du PIB réel. La régression qui maximise le R carré ajusté est ensuite sélectionnée en tant que modèle préféré. Cela produit 13 modèles qui fonctionnent raisonnablement bien pour expliquer la croissance du PIB réel. De plus, les modèles fonctionnent généralement bien pour expliquer la récession de 2008 et d’autres fluctuations propres à une province ou à un territoire.

3.1.3 Moindre contraction absolue et opérateur de sélection

Le LASSO est la solution à un problème d’optimisation restreint semblable aux MCO. Sous une régression linéaire classique, $X = [x_{1}, x_{2}, ..., x_{p}]$ est une matrice n x p contenant les variables prédictrices utilisées pour expliquer la variation dans un vecteur cible $y$ de longueur n. Les coefficients pour la régression $\hat{β} = [\hat{β_{0}}, ..., \hat{β_{p}}]$ sont alors la solution au problème qui cherche à réduire la somme des erreurs quadratiques entre $y$ et une combinaison linéaire des variables dans $X$ :

{\hat{β}}_{O L S} | = \underset{β}{argmin} \sum_{i = 1}^{n} {(y_{i} - β_{0} - β_{1} x_{i 1} - ... - β_{p} x_{i p})}^{2}

Le LASSO (Tibshirani 1996) fait partie d’une classe d’estimateurs qui cherche à pénaliser l’estimateur des MCO pour ajustement excessif (c.-à-d. inclure trop de variables) au moyen de son paramètre de régulation $λ$ . On pourrait comparer cela à l’utilisation d’un R carré ajusté ou d’un critère de renseignement pour pénaliser l’inclusion d’un trop grand nombre de variables explicatives. Cependant, cela va plus loin que de pénaliser à cause de variables explicatives supplémentaires quand on regarde la qualité du modèle. Cela sélectionne des variables pertinentes. Le LASSO est la solution pour :

{\hat{β}}_{L A S S O} | = \underset{β}{argmin} [\sum_{i = 1}^{n} {(y_{i} - β_{0} - β_{1} x_{i 1} - ... - β_{p} x_{i p})}^{2} + λ \sum_{j = 1}^{p} (| β_{j} |)]

Le paramètre $λ \geq 0$ contrôle la force de la pénalité; plus la valeur de lambda est grande, plus la valeur du rétrécissement est importante. L’algorithme LASSO peut uniquement inclure des valeurs pour $β_{j}$ jusqu’à un total absolu précis. Par conséquent, le LASSO fixe à 0 les coefficients variables moins importants. On peut considérer cela comme semblable au type de résultat trouvé en employant une stratégie de modélisation générale à spécifique/guidée par descriptions approximatives, mais qui est applicable à plus grande échelle. Le résultat est une méthode pour traiter de grands ensembles de données où un grand nombre de prédicteurs peuvent être inclus, et l’algorithme sélectionnera ceux dont les propriétés de covariance sont les plus importantes pour prédire la variable cible ( $y$ ).

Le LASSO a lui aussi des limites. Dans les cas où les groupes de variables prédictives sont fortement corrélés les uns aux autres, le LASSO tend à garder une variable de chaque groupe et à contracter le coefficient des autres variables à zéro. Et dans d’autres cas, lorsque l’ensemble de données a un petit n et un grand p, le LASSO sélectionne au maximum n variables avant d’être saturé. Cependant, il peut y avoir plus de variables n avec un coefficient qui n’est pas égal à zéro dans le vrai modèle.

La méthode elastic-net (Zou et Hastie, 2005) est une extension du LASSO. En contrôlant le poids de pénalité $α$ , le modèle elastic-net stabilise la sélection des variables à partir d’un groupe de variables corrélées et supprime la limite au nombre de variables sélectionnées. Les coefficients sont estimés comme suit :

{\hat{β}}_{E N} À = \underset{β}{argmin} {\sum_{i = 1}^{n} {(y_{i} - β_{0} - β_{1} x_{i 1} - ... - β_{p} x_{i p})}^{2} + λ \sum_{j = 1}^{p} [\frac{1}{2} (1 - α) β_{j}^{2} + α | β_{j} |]}

Où $0 \leq α \leq 1$ est la pondération de pénalité. Comme $α$ est égal à 1, le modèle elastic-net est le même que pour le modèle LASSO et, comme $α$ est proche de 1, le modèle elastic-net se comporte de façon semblable au LASSO, mais élimine le comportement problématique causé par de fortes corrélations entre les variables.

Les données de sortie du LASSO en matière du nombre de variables sélectionnées et de leur importance statistique ont été soigneusement étudiées. Dans presque tous les cas où le LASSO fonctionnait, le LASSO semble inclure dans le modèle des variables qui ne sont pas statistiquement importantes. Pour s’assurer que la relation entre le y cible et les variables explicatives est justifiable avec un meilleur résultat statistique, une analyse graduelle par régression avec sélection descendante est utilisée sur les variables sélectionnées par le LASSO pour enlever les variables non significatives du modèle.

L’analyse graduelle par régression est une méthode qui examine l’importance statistique de chaque variable indépendante au sein du modèle. Elle construit un modèle en ajoutant successivement (sélection ascendante) ou en supprimant (sélection descendante) des variables en fonction des statistiques t de leurs coefficients estimés. La méthode d’élimination descendante commence par l’inclusion de toutes les variables dans le modèle, puis chaque variable est supprimée une par une, pour tester son importance. Les variables qui ne sont pas statistiquement significatives sont enlevées du modèle.

Le modèle LASSO n’a pas choisi de variables pour le Nouveau-Brunswick, la Nouvelle-Écosse, l’Ontario et les Territoires du Nord-Ouest. La méthode elastic-net est utilisée à sa place pour ces provinces et territoires. Et pour les deux autres territoires, le Yukon et le Nunavut, une analyse graduelle par régression manuelle est effectuée.

Dans les deux méthodes, LASSO et elastic-net, la validation croisée du progiciel caret R est utilisée pour ajuster les paramètres lambda et alpha. La validation croisée utilise une technique de prévision continue de l’origine (Hyndman et Athanasopoulos, 2014) au lieu de l’échantillonnage aléatoire simple. Cette technique est propre aux ensembles de données des séries chronologiques.

4 Évaluation mensuelle de l’indice

Les trois approches présentent en outre des points forts et des points faibles qui leur sont propres, et qui ont une incidence sur leur utilisation (tableau 6). Les indices simples et le LASSO ont pour avantage que leurs modèles sont parcimonieux et que les indices qu’ils produisent sont moins bruyants que les indices fondés sur l’ACP. Cependant, ces indices sont basés sur un ensemble de variables très réduit, qui sont souvent non statistiquement significatives pour les indices simples dans les régressions annuelles. Ces indices tendent aussi à mettre l’accent sur les séries relatives à l’emploi plutôt que sur un large éventail d’activités économiques et peuvent, par conséquent, ne pas présenter de valeurs explicatives idéales des fluctuations mensuelles de l’activité, si les variations de la production ne rendent pas compte au même moment des variables d’emploi.

L’indice ACP a pour avantage que la méthodologie est saine et bien comprise. Il fonctionne pour toutes les provinces et tous les territoires. Cependant, il produit les indices d’activité les plus bruyants, rendant leur interprétation difficile; de plus, dans certains cas (p. ex. T.-N.), l’indice peut diminuer brusquement. Les indices ACP sont aussi combinés en fonction de la maximisation du R carré ajusté d’une régression à l’autre. Cela produit une combinaison linéaire des composantes principales qui sont statistiquement significatives et non significatives. Ces inclusions préfèrent ajouter des renseignements supplémentaires qui incluent un certain bruit, car il n’est pas clair que les données à une fréquence annuelle représentent la variabilité d’un mois à l’autre.

Tableau 6
Caractéristiques des méthodes d’estimation d’indice
Sommaire du tableau
Le tableau montre les résultats de Caractéristiques des méthodes d’estimation d’indice. Les données sont présentées selon Critère (titres de rangée) et Indice simple, Indice ACP, Indice pondéré et Indice LASSO(figurant comme en-tête de colonne).
Critère	Indice simple	Indice ACP	Indice pondéré	Indice LASSO
Données d’entrée cohérentes pour tous les niveaux géographiques	Oui	Non	Non	Non
Modèle-types cohérents pour tous les niveaux géographiques	Oui	Oui	Oui	Non
Spécification du modèle	Trois données d’entrée, quelques variables non significatives	Nombre variable de composantes principales. Quelques variables non significatives	Combinaison des indices simples et ACP	Sélection de données d’entrée variable
Adéquation du modèle	Adéquation du modèle peut varier entre les provinces et les territoires	Adéquation généralement bonne pour l’échantillon	Adéquation pour l’échantillon améliorée par rapport aux indices simples et ACP	Adéquation généralement bonne pour l’échantillon
Intelligibilité	Données d’entrée et contributions faciles à comprendre	Difficile de comprendre ce qui contribue aux variations Difficile d’interpréter les composantes principales Indices à variabilité élevée	Difficile de comprendre ce qui contribue aux variations	Données d’entrée fondées sur des corrélations Contributions pouvant être interprétées Indice à faible variance
Adéquation du modèle	Ces modèles peuvent ne pas être efficaces selon l’importance statistique Les données d’entrée reflètent les attentes pour les variables importantes.	Ces modèles peuvent ne pas être efficaces selon l’importance statistique Utilisation exhaustive des données d’entrée	Hérite des propriétés des indices de données d’entrée	Approche de modélisation non adaptée à la configuration actuelle
Note : ACP : analyse en composantes principales; LASSO : moindre contraction absolue et opérateur de sélection. Source : Statistique Canada, compilation des auteurs.

La combinaison des indices fournit une méthode supplémentaire pour leur utilisation. Puisque l’indice simple est relativement stable, mais se concentre sur un nombre limité de séries fondamentales, et que l’indice ACP est plus variable, mais comprend des combinaisons linéaires de toutes les entrées, ces séries sont combinées pour fournir un indice pondéré présentant de meilleures caractéristiques que les composantes. Pour toutes les méthodes, les indices produits génèrent généralement des types similaires de renseignements sur les cycles économiques et les principaux chocs économiques dans les provinces et les territoires. Comme pour les coefficients de régression, la croissance annuelle du PIB réel est utilisée comme comparaison, car elle constitue la principale source d’activité économique agrégée qui est disponible pour les provinces et les territoires. Pour combiner l’indice ACP et l’indice simple, les valeurs de degré de liberté entre 1 % et 100 % sont utilisées pour créer des indices pondérés comme suit :

i n d i c e_p o n d é r é = (1 - ν) * i n d i c e_s i m p l e + ν * i n d i c e_d' a c t i v i t é

Le degré de liberté correspondant à l’indice pondéré qui a la plus forte corrélation avec la croissance du PIB réel est alors sélectionné.

Les méthodes utilisées pour produire des indices mensuels donnent généralement des types semblables de renseignements sur les cycles économiques et les chocs économiques majeurs dans les provinces et les territoires. À titre d’exemples, les indices pour l’Alberta (panel 1) et Terre-Neuve-et-Labrador (panel 2) sont présentés ci-dessous.

Dans le cas d’une économie plus vaste, comme celle de l’Alberta, toutes les approches donnent des renseignements similaires sur les périodes de croissance ou de déclin, mais l’ampleur des cycles peut varier selon la méthodologie. En général, les indices basés sur l’ACP ont la plus grande variabilité, alors que l’indice simple a le moins de variabilité. Dans certains cas, comme l’indice ACP pour Terre-Neuve-et-Labrador, le modèle ne produit pas un résultat raisonnable. Dans ces cas, l’indice ne sera pas rendu disponible et est jugé impropre à l’utilisation. Néanmoins, lorsque les indices semblent présenter les caractéristiques appropriées, il y a une forte corrélation entre les mesures de l’activité économique implicite et le mouvement des indices dans le temps correspond à ce que l’on sait sur la performance économique des provinces et des territoires.

De plus, les comparaisons avec les estimations sous-annuelles du PIB réel pour l’Ontario et le Québec montrent que les taux de croissance d’une année à l’autre sont fortement corrélés, mais que les cycles économiques peuvent être accentués dans les indices d’activité. Les indices semblent donc saisir des renseignements pertinents pour les cycles économiques, les périodes de croissance plus forte ou plus faible et pour comprendre la performance économique. Ils ne correspondent toutefois pas directement au PIB réel et ne doivent pas être interprétés comme une mesure directe du PIB réel.

Graphique 1

Tableau de données du graphique 1

Tableau de données du graphique 1
Sommaire du tableau
Le tableau montre les résultats de Tableau de données du graphique 1 Indice d’activité basé sur les composantes principales, Indice simple, Indice pondéré et Indice basé sur le LASSO, calculées selon niveau de l'indice unités de mesure (figurant comme en-tête de colonne).
	niveau de l'indice
	Indice d’activité basé sur les composantes principales	Indice simple	Indice pondéré	Indice basé sur le LASSO
01/01/2002	44,02	46,61	43,8	53,41
01/02/2002	42,57	47,96	43,94	54,03
01/03/2002	43,38	46,68	43,61	53,1
01/04/2002	43,66	47,1	43,95	52,9
01/05/2002	42,7	47,27	43,63	53,07
01/06/2002	46,2	48,41	45,75	54,21
01/07/2002	48,41	48,82	46,9	54,67
01/08/2002	49,49	51,78	48,98	56,37
01/09/2002	48,55	51,02	48,18	55,53
01/10/2002	48,16	51,42	48,23	55,81
01/11/2002	48,55	51,27	48,32	55,87
01/12/2002	51,29	51,54	49,6	56,95
01/01/2003	49,35	51,91	49,03	56,81
01/02/2003	50,07	50,62	48,62	56,36
01/03/2003	49,06	52,54	49,28	57,45
01/04/2003	46,89	51,99	48,06	57,38
01/05/2003	51,1	51,61	49,67	57,31
01/06/2003	51,11	51,9	49,84	57,42
01/07/2003	53,42	51,25	50,42	57,95
01/08/2003	54,38	50,81	50,55	57,93
01/09/2003	55,08	51,13	51,01	58,18
01/10/2003	58,9	53,63	53,94	60,27
01/11/2003	57,34	53,12	53,04	59,42
01/12/2003	58,65	51,93	52,87	58,7
01/01/2004	58,52	53,3	53,62	59,04
01/02/2004	57,42	52,46	52,71	58,44
01/03/2004	61,58	54,96	55,77	60,01
01/04/2004	63,78	57,09	57,86	61,91
01/05/2004	64,62	58,28	58,88	62,76
01/06/2004	63,31	58,73	58,64	62,47
01/07/2004	63,92	59,92	59,57	63,02
01/08/2004	67,74	61,08	61,74	63,31
01/09/2004	72,25	64,06	65,2	64,77
01/10/2004	69,04	63,96	63,93	64,7
01/11/2004	71,06	65,47	65,59	65,95
01/12/2004	75,37	68,87	69,24	67,56
01/01/2005	74,58	68,91	68,95	66,55
01/02/2005	78,88	70,83	71,74	68,35
01/03/2005	79,81	71,25	72,34	69,63
01/04/2005	83,03	74,76	75,64	70,38
01/05/2005	86,59	78,15	78,99	72,45
01/06/2005	86,26	77,58	78,53	72,65
01/07/2005	90,69	80,97	82,21	74,71
01/08/2005	92,54	82,08	83,57	75,23
01/09/2005	89,46	82,22	82,48	75,36
01/10/2005	93,96	83,52	84,98	76
01/11/2005	99,23	84,08	87,32	76,41
01/12/2005	105,42	86,85	91,27	77,9
01/01/2006	112,03	92,56	97,16	81,19
01/02/2006	124,82	97,78	104,99	86,05
01/03/2006	129,22	98,89	107,23	85,29
01/04/2006	131,71	104,09	111,37	87,32
01/05/2006	151,64	108,36	121,1	90,3
01/06/2006	157,75	114,43	127,09	92,96
01/07/2006	155,85	111,55	124,59	92,11
01/08/2006	154,08	110,1	123,06	91,1
01/09/2006	158,42	114,46	127,34	94,08
01/10/2006	164,81	114,27	129,37	95,42
01/11/2006	189,61	123,48	143,6	99,53
01/12/2006	182,2	129,73	145,46	100,77
01/01/2007	190,56	134,1	151,1	102,35
01/02/2007	198,82	136,14	155,18	103,41
01/03/2007	198,63	138,32	156,56	105,25
01/04/2007	199,1	134,66	154,32	102,72
01/05/2007	190,58	133,71	150,91	102,79
01/06/2007	206,86	138,25	159,3	104,63
01/07/2007	206,74	135,7	157,55	104,9
01/08/2007	221,09	137,19	163,15	106,49
01/09/2007	212,06	134,81	158,71	104,74
01/10/2007	212,26	137,38	160,52	105,98
01/11/2007	222,26	136,46	163,08	105,2
01/12/2007	214,99	134,42	159,43	105,75
01/01/2008	213,26	139,22	162,19	107,36
01/02/2008	210,38	137,17	159,88	105,66
01/03/2008	229,88	145,51	171,75	109,47
01/04/2008	227,03	147,08	171,93	111,48
01/05/2008	217,63	143,91	166,79	110,19
01/06/2008	224,1	146,92	170,9	111,12
01/07/2008	228,86	148,4	173,41	111,88
01/08/2008	231,95	154,54	178,56	113,96
01/09/2008	245,26	151,44	180,79	113,02
01/10/2008	251,6	152,78	183,68	113,92
01/11/2008	226,74	146,33	171,56	110,44
01/12/2008	199,86	140,83	159,28	106,41
01/01/2009	184,33	130,35	147,21	101,74
01/02/2009	152,56	123,85	132,29	98,07
01/03/2009	132,39	110,29	116,55	91,91
01/04/2009	120,77	104,76	108,86	88,75
01/05/2009	117,82	104,35	107,49	86,86
01/06/2009	111,94	97,83	101,34	84,4
01/07/2009	109,03	97,57	100,08	83,67
01/08/2009	96,8	87,94	89,64	79,63
01/09/2009	103,38	89,66	93,21	80,47
01/10/2009	95,74	87,62	89,09	78,73
01/11/2009	98,14	86,53	89,38	78,59
01/12/2009	101,93	86,01	90,52	78,65
01/01/2010	104,88	91,76	95,14	80,38
01/02/2010	101,29	91,16	93,4	79,83
01/03/2010	106,13	92,36	96	80,49
01/04/2010	112,77	93,93	99,46	82,04
01/05/2010	114,31	93,21	99,59	82,08
01/06/2010	114,69	95,96	101,43	83,79
01/07/2010	113,32	97,73	102,01	83,77
01/08/2010	114,88	97,17	102,26	83,54
01/09/2010	115,52	99,14	103,7	85,08
01/10/2010	123,24	102,62	108,72	87,49
01/11/2010	117,97	100,26	105,32	87,09
01/12/2010	124,56	105,13	110,76	89,72
01/01/2011	129,69	103,5	111,68	89,83
01/02/2011	139,07	106,75	117,11	92,08
01/03/2011	142,32	108,93	119,64	92,54
01/04/2011	150,84	113,07	125,29	94,7
01/05/2011	143,64	111,31	121,65	93,88
01/06/2011	159,07	118,1	131,44	97,47
01/07/2011	162,9	121,64	135,05	98,81
01/08/2011	170,97	121,2	137,58	99,78
01/09/2011	177,27	125,39	142,46	102,34
01/10/2011	181,7	126,83	144,91	103,3
01/11/2011	187,92	130,88	149,68	105,69
01/12/2011	202,43	135,47	157,58	108,6
01/01/2012	200,04	136,08	157,21	108,2
01/02/2012	203,94	137,33	159,33	107,93
01/03/2012	215,35	143,44	167,19	111,99
01/04/2012	231,23	147,11	174,84	113,99
01/05/2012	246,96	158,95	188	119,03
01/06/2012	245,54	163,36	190,57	121,09
01/07/2012	251,4	163,48	192,57	121,8
01/08/2012	255,07	167,99	196,83	123,66
01/09/2012	256,26	166,98	196,53	122,35
01/10/2012	256,04	163,98	194,41	121,8
01/11/2012	282,48	168,88	206,21	124,01
01/12/2012	257,26	162,99	194,31	121,25
01/01/2013	269,64	166,71	200,8	123,41
01/02/2013	278,58	174,14	208,79	126,47
01/03/2013	285,1	178,01	213,54	128,04
01/04/2013	284,24	178,9	213,88	129,26
01/05/2013	295,09	181,18	218,89	130,5
01/06/2013	276,77	180,16	212,47	129,64
01/07/2013	293,1	185,99	221,72	132,52
01/08/2013	308,64	190,45	229,75	134,29
01/09/2013	297,08	187,28	223,91	134,34
01/10/2013	303,6	193,58	230,35	136,04
01/11/2013	309,71	194,63	233,02	136,76
01/12/2013	300,19	192,49	228,53	136,8
01/01/2014	305,95	195,89	232,71	138,24
01/02/2014	331,2	199,63	243,35	139,67
01/03/2014	320	202,51	241,93	139,89
01/04/2014	306,86	206,6	240,59	141,57
01/05/2014	338,35	210,18	253,38	144,25
01/06/2014	360,37	217,84	265,66	145,48
01/07/2014	362,64	217,87	266,39	146,54
01/08/2014	365,55	228,27	274,66	149,51
01/09/2014	380,11	229,51	280,12	152,28
01/10/2014	375,74	229,38	278,68	153,12
01/11/2014	352,84	218,69	264,01	149,41
01/12/2014	366,34	218,46	268,09	149,61
01/01/2015	361,92	217,89	266,33	151,59
01/02/2015	306,55	204,05	239,4	143,6
01/03/2015	299,28	197,25	232,39	140,47
01/04/2015	295,88	191,31	227,22	139,19
01/05/2015	281,93	189,24	221,3	136,94
01/06/2015	260,26	175,06	204,53	131,56
01/07/2015	252,67	173,31	200,84	130,75
01/08/2015	230,04	163,62	186,78	126,55
01/09/2015	231,82	162,33	186,53	124,92
01/10/2015	211,19	158,65	177,11	123,26
01/11/2015	199,83	154,68	170,53	120,67
01/12/2015	194,02	151,04	166,12	118,77
01/01/2016	168,77	137,88	148,65	112,8
01/02/2016	155,99	129,98	138,98	108,6
01/03/2016	157,89	128,71	138,91	108,89
01/04/2016	152,23	128,23	136,51	106,99
01/05/2016	122,95	118,24	119,31	102,17
01/06/2016	123,07	118,25	119,37	101,38
01/07/2016	123,43	116,97	118,77	100,09
01/08/2016	119,78	110,53	113,5	97,46
01/09/2016	120,69	109,76	113,4	97,07
01/10/2016	118,47	106,32	110,47	96,07
01/11/2016	114,29	105,29	108,2	94,64
01/12/2016	115,2	106,63	109,37	96,17
01/01/2017	114,58	105,27	108,31	95,49
01/02/2017	122,6	109,75	114,17	98,4
01/03/2017	119,37	107,19	111,36	96,66
01/04/2017	122,15	107,16	112,44	96,39
01/05/2017	132,14	110,7	118,45	98,47
01/06/2017	136,75	115,5	123,16	101,72
01/07/2017	134,51	115,82	122,52	102,28
01/08/2017	134,36	116,62	122,94	102,25
01/09/2017	133,1	116,94	122,66	102,76
01/10/2017	138,57	114,98	123,58	102,86
01/11/2017	139,61	113,7	123,17	102,16
01/12/2017	136,83	113,16	121,81	102,4
01/01/2018	137,46	114,2	122,69	102,85
01/02/2018	138,15	112,28	121,76	102,74
01/03/2018	145,44	115,03	126,19	104,34
01/04/2018	141,36	114,17	124,15	105,22
01/05/2018	143,43	116,15	126,16	106,82
01/06/2018	135,88	115,2	122,77	106,09
01/07/2018	127,34	109,22	115,84	102,31
01/08/2018	132,52	110,19	118,41	103,62
01/09/2018	127,19	108,21	115,18	101,71
01/10/2018	124,91	109,43	115,06	102,67
01/11/2018	140,51	108,39	120,46	104,76
01/12/2018	122,05	105,9	112,21	102,77
01/01/2019	121,52	108,71	113,73	103,86
01/02/2019	119,51	107,99	112,51	104,21
01/03/2019	117,9	106,8	111,15	103,37
01/04/2019	120,14	106,63	111,94	103,2
01/05/2019	118,47	106,15	110,99	103,11
01/06/2019	120,62	104,4	110,78	102,44
01/07/2019	115,19	106,68	110,08	102,69
01/08/2019	112,98	106,6	109,15	103,03
01/09/2019	113,06	104,25	107,79	103,06
01/10/2019	112,01	103,32	106,81	102,05
01/11/2019	101,43	101,08	101,22	100,56
01/12/2019	100	100	100	100
01/01/2020	95,17	96,91	96,18	99,03
01/02/2020	95,22	91,26	92,95	96,41
01/03/2020	36,95	55,25	47,79	72,21
Note : LASSO = moindre contraction absolue et opérateur de sélection. Source : Statistique Canada, calculs des auteurs.

Graphique 2

Tableau de données du graphique 2

Tableau de données du graphique 2
Sommaire du tableau
Le tableau montre les résultats de Tableau de données du graphique 2 Indice d’activité basé sur les composantes principales, Indice simple, Indice pondéré et Index basé sur le LASSO, calculées selon niveau de l'indice unités de mesure (figurant comme en-tête de colonne).
	niveau de l'indice
	Indice d’activité basé sur les composantes principales	Indice simple	Indice pondéré	Index basé sur le LASSO
01/01/2002	5562,24	79,43	85,09	80,21
01/02/2002	5224,48	82,88	87,45	78,31
01/03/2002	4243,91	82,37	84,54	78,13
01/04/2002	5626,24	84,65	90,65	80,77
01/05/2002	6239,63	81,43	89,2	82,66
01/06/2002	5657,11	81,77	88,28	83,57
01/07/2002	6292,55	82,05	90,01	84,18
01/08/2002	5814,76	82,49	89,4	83,92
01/09/2002	6267,22	82,16	90,14	85,7
01/10/2002	7667,45	82,73	93,69	89,83
01/11/2002	7413,24	82,92	93,41	91,66
01/12/2002	6900,72	82,58	92,12	90,72
01/01/2003	6240,78	82,16	90,4	92,15
01/02/2003	7319,34	81,15	91,79	93,04
01/03/2003	8199,98	81,5	93,79	95,4
01/04/2003	8855,62	80,74	94,17	91,16
01/05/2003	4712,39	81,16	87,98	88,97
01/06/2003	4942,04	81,57	89	91,22
01/07/2003	6042,07	81,75	92,14	92,7
01/08/2003	5297,57	82,13	90,8	90,71
01/09/2003	5638,03	81,89	91,45	92,14
01/10/2003	5705,55	82,33	92,03	89,2
01/11/2003	6637,96	80,51	92,55	91,53
01/12/2003	6354,64	80,75	92,2	92,96
01/01/2004	6377,55	83,85	95,26	94,08
01/02/2004	5984,01	83,32	93,86	93,11
01/03/2004	5781,09	84,31	94,33	92,74
01/04/2004	8976,38	83,1	101	93,32
01/05/2004	1043,44	82,13	86,61	89,81
01/06/2004	1157,32	84,15	89,84	92,31
01/07/2004	919,54	83	86,03	92,46
01/08/2004	1002,15	82,87	87,07	93,35
01/09/2004	1046,54	82,96	87,73	93,51
01/10/2004	956,18	83,13	86,75	91,98
01/11/2004	1082,97	83,53	88,83	93,92
01/12/2004	1096,23	82,95	88,47	93,98
01/01/2005	1116,83	82,75	88,53	93,83
01/02/2005	1076,08	83,74	88,95	95,46
01/03/2005	1129	82,7	88,67	94,95
01/04/2005	1016,3	83,22	87,82	93,02
01/05/2005	1098,25	81,74	87,55	91,89
01/06/2005	1176,3	82,06	88,78	92,55
01/07/2005	1088,7	82,72	88,39	93,77
01/08/2005	1129,19	82,43	88,62	94,73
01/09/2005	1369,72	82,15	91,19	97,08
01/10/2005	1143,89	81,95	88,75	96,92
01/11/2005	1272,18	82,39	90,65	97,13
01/12/2005	1155,15	82,72	89,71	96,55
01/01/2006	1105,85	83,92	90,24	97,59
01/02/2006	1022,72	83,8	89,11	96,3
01/03/2006	1259,88	82,88	91,38	98,09
01/04/2006	1598,84	85,67	97,68	100,91
01/05/2006	1009,01	84,61	91,25	97,97
01/06/2006	920,31	84,23	89,7	96,91
01/07/2006	1062,74	84,44	91,97	99,3
01/08/2006	1117,95	84,42	92,67	100,63
01/09/2006	962,48	84,22	90,55	98,02
01/10/2006	891,39	83,85	89,21	93,66
01/11/2006	515,95	84,98	84,6	95,24
01/12/2006	639,62	85,12	87,75	97,2
01/01/2007	718,78	85,51	89,72	98,18
01/02/2007	648,56	85,72	88,6	96
01/03/2007	670,28	86,26	89,51	99,94
01/04/2007	592,42	85,91	87,65	100,93
01/05/2007	762,1	86,63	92,04	101,5
01/06/2007	769,86	87,65	93,1	103,11
01/07/2007	518,87	87,32	88,25	101,85
01/08/2007	487,58	87,06	87,22	100,81
01/09/2007	499,02	87,96	88,3	100,92
01/10/2007	584,42	86,96	89,71	104,28
01/11/2007	276,1	87,64	83,21	105,64
01/12/2007	420,52	87,82	89,89	105,83
01/01/2008	397,36	88,9	90,08	107,45
01/02/2008	378,08	87,45	88,18	106,61
01/03/2008	381,3	88,94	89,56	107,61
01/04/2008	343,09	89,24	88,48	106,06
01/05/2008	382,96	89,14	89,94	109
01/06/2008	484,06	90,99	95,08	109,61
01/07/2008	552,41	91,47	97,52	111,14
01/08/2008	564,08	90,41	96,87	110,34
01/09/2008	496,56	91,21	95,86	108,02
01/10/2008	401,15	91,39	93,26	105,07
01/11/2008	395,31	89,98	91,83	106,9
01/12/2008	317,61	88,5	87,84	102,41
01/01/2009	315,15	87,29	86,72	100,27
01/02/2009	375,72	90,33	91,79	100,7
01/03/2009	309,45	89,43	88,58	98,69
01/04/2009	381	88,94	91,24	98,34
01/05/2009	227,61	89,52	86,23	95,2
01/06/2009	179,03	88,21	82,4	95,84
01/07/2009	187,74	88,7	83,39	94,13
01/08/2009	194,6	90,51	85,29	95,36
01/09/2009	186,3	89,79	84,18	92,3
01/10/2009	200,51	90,83	85,97	93,41
01/11/2009	236,33	90,01	87,61	95,4
01/12/2009	211,69	89,78	86,05	93,21
01/01/2010	192,67	90,29	85,3	93,07
01/02/2010	191,56	90,71	85,57	92,63
01/03/2010	187,44	90,41	85,05	91,48
01/04/2010	222,62	90,44	87,47	96,67
01/05/2010	186,31	90,45	85,34	97,23
01/06/2010	181,82	91,75	86,07	92,9
01/07/2010	195,99	90,85	86,36	93,1
01/08/2010	179,67	91,77	86,03	92,81
01/09/2010	150,84	91,84	84,01	93,32
01/10/2010	180,48	92,38	86,9	97,67
01/11/2010	221,21	92,94	90,29	99,72
01/12/2010	181,91	93,74	88,55	97,65
01/01/2011	206,77	93,54	90,21	98,85
01/02/2011	187,98	92,59	88,2	98,28
01/03/2011	201	95,23	91,25	98,67
01/04/2011	140,74	94,21	86,32	102,23
01/05/2011	162,37	93,96	88,11	102,39
01/06/2011	157,52	93,24	87,14	98,21
01/07/2011	144,83	93,42	86,23	100,57
01/08/2011	140,45	93,81	86,15	98,95
01/09/2011	166,69	95,38	89,78	99,3
01/10/2011	138,77	95,91	87,95	101,57
01/11/2011	164,42	96,13	90,56	104,76
01/12/2011	147,8	94,85	88,17	99,43
01/01/2012	142,08	96,22	88,74	98,02
01/02/2012	148,76	95,74	88,98	99,26
01/03/2012	138,32	96,41	88,58	98,81
01/04/2012	130,13	97,23	88,44	100,15
01/05/2012	148,26	96,3	89,56	99,07
01/06/2012	139,09	96,74	89,08	99,27
01/07/2012	147,07	96,41	89,59	101,18
01/08/2012	139,89	95,43	88,16	100,48
01/09/2012	143,71	95,52	88,59	98,6
01/10/2012	144,87	94,49	87,88	98,07
01/11/2012	76,93	97,55	84,12	98,14
01/12/2012	105,77	98,14	89,29	97,44
01/01/2013	110,1	98,33	89,98	96,9
01/02/2013	124,72	97,25	90,93	101,37
01/03/2013	126,11	97,57	91,34	96,88
01/04/2013	117,26	97,79	90,55	95,77
01/05/2013	121,19	100,05	92,78	96,3
01/06/2013	140,83	97,78	93,25	95,59
01/07/2013	147,7	98,68	94,67	95,71
01/08/2013	150,69	99,45	95,58	93,94
01/09/2013	145,86	99,56	95,21	93,83
01/10/2013	123,04	99,44	92,88	95,26
01/11/2013	125,26	98,31	92,23	95,27
01/12/2013	129,96	99,35	93,58	98,35
01/01/2014	116,14	99,82	92,46	97,39
01/02/2014	112,75	100,65	92,71	97,06
01/03/2014	118,67	101,05	93,76	98,02
01/04/2014	161	98,79	96,99	96,92
01/05/2014	105,85	100,86	93,73	96,98
01/06/2014	107,89	100,51	93,73	96,43
01/07/2014	114,48	102,25	95,96	96,48
01/08/2014	100,08	100,96	93,12	93,48
01/09/2014	98,67	98,89	91,31	92,31
01/10/2014	110,99	99,04	93,14	91,93
01/11/2014	120,98	99,41	94,69	91,65
01/12/2014	100,72	98,89	91,89	92,84
01/01/2015	86,14	98,79	89,82	90,75
01/02/2015	95,56	99,16	91,58	91,14
01/03/2015	106,77	98,31	92,52	90,5
01/04/2015	78,52	99,25	89,6	89,76
01/05/2015	94,69	99,1	92,25	92,56
01/06/2015	109,12	100,51	95,48	91,86
01/07/2015	109,15	98,69	94,01	91,64
01/08/2015	97,06	101,17	94,45	88,82
01/09/2015	80,65	100,61	91,61	90,74
01/10/2015	94,85	99,78	93,39	90,89
01/11/2015	94,74	98,67	92,5	93,48
01/12/2015	77,41	99,14	90,33	87,75
01/01/2016	78,59	98,31	89,89	85,93
01/02/2016	73,8	98,83	89,48	84,6
01/03/2016	62,92	98,26	87,06	82,98
01/04/2016	70,72	99,04	89,26	83,76
01/05/2016	84,59	98,91	91,79	84,32
01/06/2016	85,66	99,87	92,72	87,33
01/07/2016	76,91	97,76	89,63	82,94
01/08/2016	80,6	98,9	91,17	82,78
01/09/2016	96,01	98,86	93,75	85,34
01/10/2016	96,03	100,01	94,69	83,33
01/11/2016	101,63	100,81	96,15	85,67
01/12/2016	85,76	99,91	93,18	87,36
01/01/2017	104,53	100,64	96,81	89,11
01/02/2017	117,8	99,94	98,08	89,2
01/03/2017	99,03	99,56	95,42	87,82
01/04/2017	107,97	98,53	95,87	85,07
01/05/2017	87,54	98,89	93,45	84,81
01/06/2017	67,77	99,19	90,53	81,75
01/07/2017	67,93	98,47	90	82,18
01/08/2017	76,06	98,5	91,64	85
01/09/2017	79,49	99,06	92,7	88,71
01/10/2017	75,91	99,16	92,16	85,73
01/11/2017	76,33	98,36	91,6	87,48
01/12/2017	88,05	98,08	93,49	89,36
01/01/2018	90,06	97,6	93,42	87,6
01/02/2018	84,04	99,14	93,73	87,7
01/03/2018	74,03	98,21	91,31	86,61
01/04/2018	79,26	98,29	92,35	85,5
01/05/2018	87,79	97,65	93,32	88,91
01/06/2018	84,41	97,19	92,41	90,13
01/07/2018	88,39	99,65	95,05	90,52
01/08/2018	83,11	98,62	93,36	91,14
01/09/2018	78,01	98,75	92,61	89,41
01/10/2018	80,64	98,88	93,19	87,89
01/11/2018	54,06	97,45	87,43	87,69
01/12/2018	72,03	97,61	91,91	90,2
01/01/2019	50,7	98,78	88,76	89
01/02/2019	57,45	98,4	90,25	89,15
01/03/2019	68,69	99,5	93,75	91,92
01/04/2019	73,79	99,2	94,56	92,19
01/05/2019	66,16	98,65	92,64	92,53
01/06/2019	72,85	97,98	93,52	92,59
01/07/2019	75,07	98,67	94,5	94,2
01/08/2019	82,25	97,96	95,28	94,37
01/09/2019	81,95	97,08	94,5	94,25
01/10/2019	83,12	99,87	97,01	95,23
01/11/2019	95,79	99,41	98,85	96,55
01/12/2019	100	100	100	100
01/01/2020	106,7	98,56	99,78	99,31
01/02/2020	83,86	98,9	96,87	96,97
01/03/2020	116,72	95,31	99,58	96,15
Note : LASSO = moindre contraction absolue et opérateur de sélection. Source : Statistique Canada, calculs des auteurs.

5 Conclusion

Des mesures de l’activité économique agrégée pour les économies sont essentielles pour éclairer les décisions relatives aux politiques fiscales et financières, déterminer les caractéristiques des cycles économiques et examiner la performance économique. Dans cette étude, quatre indices d’activité économique provinciale et territoriale fondés sur différentes approches méthodologiques sont estimés et présentés. Celles-ci reposent sur un modèle simple; l’ACP; une combinaison pondérée des indices simples et de l’ACP; et le LASSO. Dans la plupart des cas, toutes les approches produisent des résultats à peu près semblables. Toutefois, le caractère cyclique et la variance des fluctuations d’un mois à l’autre peuvent être très différents. En règle générale, l’ACP produit la plus grande variabilité et les cycles les plus prononcés, alors que l’indice simple est le plus stable.

Selon les propriétés des méthodologies et de leurs données de sortie, l’indice simple est le plus uniforme entre les provinces et territoires. Il est aussi le plus facile à interpréter en termes de contributions de variables et de justification de l’inclusion de variable. Cependant, les valeurs des paramètres sont souvent non statistiquement significatives et les séries de données d’entrée sont choisies autant pour leur importance économique que pour leur présence dans toutes les provinces et tous les territoires. Par conséquent, ces modèles offrent une approche plus limitée pour l’examen de l’activité économique agrégée, mais ils constituent également une base pour les comparaisons avec des modèles plus complexes.

Les indices fondés sur l’ACP semblent donner une idée plus complète de l’évolution de l’activité au fil du temps, mais on ne sait pas encore comment les principaux éléments devraient être interprétés. À cause de cela, et parce que les indices de l’ACP présentent la plus grande variabilité, ils présentent un compromis entre l’utilisation globale des séries de données d’entrée et l’intelligibilité.

La pondération de l’indice simple et de l’indice ACP produit un résultat qui a une corrélation supérieure avec les fluctuations annuelles du PIB. La combinaison pondérée continue d’avoir plus de variabilité que l’indice simple. Étant donné que l’ACP est incluse, elle n’est pas aussi facile à interpréter que l’indice simple, mais elle fournit probablement une meilleure mesure de l’activité agrégée que ses composantes.

L’indice LASSO obtient de bons résultats en ce qui concerne le PIB réel annuel, mais la configuration du modèle n’est pas aussi adaptée à la situation rencontrée lors de l’estimation des indices d’activité. En particulier, le nombre relativement faible d’observations limite la capacité des algorithmes à effectuer une validation croisée. De plus, bien que les séries de données d’entrée constituent un sous-ensemble distinct de l’ensemble de données d’entrée et que leurs contributions puissent être générées de façon simple et directe, il n’y a aucune raison théorique pour expliquer pourquoi les variables sont importantes, ce qui limite l’intelligibilité du modèle.

Compte tenu des forces et des faiblesses présentes entre l’adéquation des modèles, leur rendement et l’examen de leurs données de sortie, les évaluations effectuées jusqu’à présent suggèrent que les indices simples ou les indices LASSO présentent des résultats liés à un ensemble de données d’entrée fondamentales (souvent fortement influencées par les séries sur l’emploi), que les indices ACP se rapportent davantage à une forme quelconque d’activité à court terme (mais le signal est bruyant) et que l’indice pondéré présente un compromis entre les deux.

Les indices tels qu’ils sont estimés actuellement sont corrélés aux mesures annuelles du PIB réel et aux mesures sous-annuelles du PIB réel pour l’Ontario et le Québec, mais ils ne doivent pas être interprétés comme une mesure du PIB réel. Les indices présentent une plus grande variabilité et un caractère cyclique plus prononcé que les mesures du PIB réel et sont constitués de mesures de la production brute, de l’emploi, de prix relatifs et de ratios importants, comme le taux de chômage. Cela rend les indices appropriés pour comprendre l’activité économique, mais ils ne sont cependant pas équivalents au PIB réel. De plus, les indices ne donnent pas de renseignements sur les différents niveaux d’activité économique entre les provinces et les territoires.

Les indices sont également basés sur un ensemble de données d’entrée et des stratégies de modélisation qui ne sont pas idéales. De nombreuses hypothèses doivent être imposées pour produire les indices, et n’importe laquelle peut s’avérer être une source d’erreurs de mesure importantes. Par conséquent, les indices présentés ici doivent être considérés comme expérimentaux et peuvent être révisés ou remplacés à mesure que les recherches futures améliorent les processus et/ou testent les hypothèses pour déterminer leur validité.

À l’heure actuelle, les corrélations entre les différentes méthodes, leur corrélation positive avec les mesures du PIB réel infra-annuel produites à l’échelon provincial et les comparaisons des propriétés avec la performance économique provinciale et territoriale connue soutiennent leur utilisation en tant qu’indicateurs de cycles économiques, pour comprendre l’ampleur des chocs par rapport à l’histoire d’une province ou d’un territoire ainsi que l’évolution des économies régionales. Les comparaisons interprovinciales sont également soutenues, mais avec la mise en garde que l’efficacité du modèle est difficile à comprendre dans toutes les situations et que les comparaisons à divers niveaux entre les provinces ne sont pas possibles à partir des valeurs d’indice.

Références

Brave, Scott, et R. Andrew Butters. 2010. « Chicago Fed National Activity Index Turns Ten—Analyzing Its First Decade of Performance. » Chicago Fed Letter, no 273 (avril). Federal Reserve Bank of Chicago. https://www.chicagofed.org/~/media/publications/chicago-fed-letter/2010/cflapril2010-273-pdf.pdf.

Statistique Canada. 2020a. « Produit intérieur brut (PIB) aux prix de base, par industries, mensuel (36 100 434). » Statistique Canada. Statistique Canada, le 24 janvier 2020. https://www150.statcan.gc.ca/n1/pub/13-607-x/2016001/230-fra.htm (consulté le 2 juin 2020)

Statistique Canada. 2020b. « Produit intérieur brut (PIB) aux prix de base, par industries, mensuel (36 100 434). » Statistique Canada. Statistique Canada, le 31 juillet 2019. https://www.statcan.gc.ca/fra/programmes-statistiques/document/1301_D1_V3 (consulté le 2 juin 2020)

Federal Reserve Board of Chicago. 2020. « Chicago Fed National Activity Index (CFNAI) Current Data. » Federal Reserve Board of Chicago, 22 juin 2020. https://www.chicagofed.org/research/data/cfnai/current-data (consulté le 2 juin 2020).

Evans, Liu, Charles L. et Genevieve Pham-Kanter. 2002. « The 2001 Recession and the Chicago Fed National Activity Index: Identifying Business Cycle Turning Points. » Economic Perspectives 26 (3). Federal Reserve Bank of Chicago : p. 26 à 43. https://www.chicagofed.org/~/media/publications/economic-perspectives/2002/3qepart2-pdf.pdf.

Hyndman, R.J., et Athanasopoulos, G. 2018. Forecasting: principles and practice, 2^e édition, OTexts : Melbourne, Australie. OTexts.com/fpp2. Consulté le 2 juin 2020.

Jolliffe, I.T. 2002. Principle Components Analysis Second Edition. Springer-Verlag New York Inc., New York, NY.

Nations Unies (ONU), Commission européenne (CE). Fonds monétaire international (FMI), Organisation de coopération et de développement économiques (OCDE) et Banque mondiale (BM). 2009. Système de comptabilité nationale, 2008. New York : Nations Unies. Disponible à : https://unstats.un.org/unsd/nationalaccount/docs/SNA2008FR.pdf (consulté le 2 juin 2020).

Organisation de coopération et de développement économiques (OCDE). 2008. Handbook on Constructing Composite Indicators Methodology and User Guide. Organisation de développement économique. https://www.oecd.org/sdd/42495745.pdf (consulté le 2 juin 2020).

Tibshirani, Robert. 1996. « Regularization Shrinkage and Selection via the Lasso. » Journal of Royal Statistical Society: Series B.

Zou, Hui et Trevor Hastie. 2005. « Regularization and Variable Selection via the Elastic Net. » Journal of Royal Statistical Society: Series B (Statistical Methodology) 67 (2): 301–20. doi:10.1111/j.1467-9868.2005.00503.x.

Notes

Note 1

On ne sait pas exactement dans quelle mesure les différences dans le nombre des données d’entrée et la diversité des données d’entrée peuvent avoir une incidence sur les comparaisons. Les plus grandes provinces disposent d’un ensemble de données plus riches dans lequel elles peuvent puiser pour modéliser leur économie. De plus, les enquêtes qui recueillent des données provinciales et territoriales comportent généralement davantage d’observations et/ou produisent des données qui présentent moins de variabilité par rapport aux mouvements tendanciels dans les plus grandes provinces. Les économies plus petites sont également moins complexes et peuvent nécessiter un moins grand nombre de séries pour résumer leurs activités.

Cette situation est normale lorsqu’on fait des comparaisons entre les économies. Par exemple, les économies plus importantes de l’Organisation de coopération et de développement économiques (OCDE), comme les États-Unis, l’Allemagne, le Royaume-Uni ou le Canada, peuvent avoir des systèmes statistiques plus importants que les économies plus modestes de l’OCDE. Cela ne veut pas dire que les données de ces économies sont incomparables. Au contraire, les études sont entreprises en tenant compte du fait que les données sont aptes à faire des comparaisons puisqu’elles reflètent ce qui se passe au sein des secteurs de compétences sur lesquels elles sont censées faire rapport, même si la quantité de renseignements statistiques disponibles diffère. La même notion devrait s’appliquer aux indices expérimentaux de l’activité économique.

Retour à la référence de note

Note 2

Le Système canadien des comptes macroéconomiques produit des mesures annuelles, trimestrielles et mensuelles du PIB pour le Canada. Les mesures sont intégrées et les mesures mensuelles du PIB réel sont calculées en se basant sur une méthodologie qui utilise des pseudo-indices à une fréquence mensuelle. Ces indices sont pondérés ensemble au moyen de formules de calcul d’indices pour former la série agrégée du PIB réel mensuel. Les indices sont étalonnés chaque année aux tableaux annuels des ressources et des emplois, ce qui permet de corriger les différences qui peuvent découler de l’utilisation de pseudo-indices au lieu des séries à valeur ajoutée à double déflation produites dans les tableaux des ressources et des emplois.

Retour à la référence de note

Note 3

Des méthodes détaillées pour les industries individuelles ainsi que des discussions sur les pseudo-indices et leur utilisation sont disponibles à Canada (2020a).

Retour à la référence de note

Note

Il est plus traditionnel d’utiliser les différences logarithmiques dans l’analyse des séries chronologiques. Dans ce cas, les taux de croissance sont utilisés parce que le taux de changement est limité à -100 %, ce qui n’est pas le cas avec les différences logarithmiques. La mise en œuvre d’un examen approprié des propriétés de stationnarité de la série des données d’entrée demeure une priorité pour les travaux futurs.

Retour à la référence de note

Date de modification :: 2020-08-31

Sélection de la langue

Recherche et menus

Recherche

Études analytiques : méthodes et références
Indices expérimentaux de l’activité économique des provinces et territoires au Canada : mesures expérimentales fondées sur des combinaisons de séries chronologiques mensuelles

Remerciements

Résumé

1 Introduction

2 Ensemble de données d’entrée

3 Estimation

3.1 Stratégie d’estimation

3.1.1 Modèle simple

3.1.2 Analyse des composantes principales

3.1.3 Moindre contraction absolue et opérateur de sélection

4 Évaluation mensuelle de l’indice

5 Conclusion

Références

Études analytiques : méthodes et références Indices expérimentaux de l’activité économique des provinces et territoires au Canada : mesures expérimentales fondées sur des combinaisons de séries chronologiques mensuelles

Remerciements

Résumé

1 Introduction

2 Ensemble de données d’entrée

3 Estimation

3.1 Stratégie d’estimation

3.1.1 Modèle simple

3.1.2 Analyse des composantes principales

3.1.3 Moindre contraction absolue et opérateur de sélection

4 Évaluation mensuelle de l’indice

5 Conclusion

Références

Note de reconnaissance

Normes de service à la clientèle

Droit d'auteur

Études analytiques : méthodes et références
Indices expérimentaux de l’activité économique des provinces et territoires au Canada : mesures expérimentales fondées sur des combinaisons de séries chronologiques mensuelles