Série de documents analytiques et techniques sur les comptes et la statistique de l'environnement
Estimation de la quantité d’eau potable au Canada de 2005 à 2019
Passer au texte
Début de l'encadré
Résumé
Avec l’accroissement démographique, l’urbanisation et l’industrialisation, la demande mondiale en eau potable a considérablement augmenté. Par conséquent, de nombreux pays, dont le Canada, sont confrontés à une demande croissante en eau potable de qualité, ce qui exerce une pression importante sur les usines de traitement de l’eau. Celles-ci fournissent de l’eau à diverses fins, y compris la production d’énergie thermoélectrique et l’utilisation domestique, commerciale et industrielle. Afin de mieux comprendre les tendances de la production d’eau potable, de prévoir l’utilisation future de l’eau et d’assurer un développement durable dans la conception et la planification des systèmes d’approvisionnement en eau potable, il est essentiel de disposer de données précises, fiables et recueillies de façon ininterrompue sur les volumes d’eau potable traités par les usines de traitement. Le présent article porte sur l’examen des limites causées par la fréquence de l’Enquête biennale sur les usines de traitement de l’eau potable de Statistique Canada sur l’analyse de la production d’eau. Il aborde diverses techniques de modélisation et présente un modèle de prédiction robuste qui vise à fournir des estimations de la production d’eau pour les années non couvertes par l’enquête à l’échelle nationale au Canada.
Dans le cadre de cette étude, les données trimestrielles sur l’eau pour la période allant de 2005 à 2019, combinées à des données auxiliaires, comme le produit intérieur brut et les estimations démographiques, ont été utilisées pour la modélisation. L’étude aborde différentes techniques, dont la régression par les moindres carrés partiels, la forêt aléatoire et la régression spline. Selon des analyses de validation croisée, le modèle de régression spline s’est avéré être la technique la plus efficace et a été utilisé pour fournir une évaluation exhaustive de la production d’eau potable par les usines de traitement de l’eau pour la période allant de 2005 à 2019. Cette approche avait l’avantage de combler efficacement des lacunes statistiques qui n’avaient pas fait l’objet d’une enquête, ce qui a permis d’effectuer une évaluation plus exacte et plus complète de la production d’eau. Dans l’ensemble, les conclusions de l’étude démontrent la possibilité d’utiliser un modèle de régression spline pour prévoir la production d’eau potable et pour combler des lacunes statistiques, en mettant en évidence l’importance de ce modèle pour la gestion des ressources en eau et l’élaboration de politiques au Canada.
Mots-clés : eau potable, forêt aléatoire, modèle de prédiction, régression spline
1 Introduction
Le besoin en eau potable dans le monde augmente en raison du rythme de croissance rapide de la population, de l’urbanisation et de l’industrialisation (Smeti et coll., 2009). Pour assurer une prospérité à long terme, le gouvernement et les décideurs politiques doivent avoir accès à des données exactes, fiables et recueillies de façon continue sur le volume d’eau potable. De telles données sont essentielles pour planifier efficacement l’approvisionnement et la demande en eau.
De 2005 à 2019, le nombre de personnes au Canada approvisionnées en eau par les services publics a augmenté de plus de 5 millions (+18,8 %). Cependant, au cours de la même période, la production totale d’eau potable au Canada a diminué pour passer de 5 706,2 millions de mètres cubes en 2005 à 4 866,1 millions de mètres cubes en 2019. La baisse récente de production d’eau potable pourrait indiquer une transition vers des habitudes de consommation plus durables, possiblement en raison de meilleures pratiques des ménages en matière de conservation de l’eau, des percées technologiques et d’autres facteurs. Toutefois, l’étendue de cette tendance peut varier selon la région, en fonction de facteurs tels que l’économie locale, les politiques, le climat régional et la croissance démographique (Ryan et Wang, 2012).
Il est important de fournir des données de séries chronologiques continues sur le volume d’eau produit par les usines de traitement pour mieux comprendre les tendances de l’utilisation de l’eau et prévoir l’utilisation future. L’Enquête biennale sur les usines de traitement de l’eau potable de Statistique Canada fournit des estimations continues de la production d’eau; toutefois, la fréquence de cette enquête limite l’analyse. Par conséquent, le présent article aborde différentes techniques de modélisation et propose un modèle de prédiction robuste permettant de fournir des estimations de la production d’eau pour les années non couvertes par l’enquête à l’échelle nationale pour le Canada.
De nombreuses études ont été menées afin d’examiner le lien entre l’utilisation de l’eau potable et des variables démographiques, telles que la population (Schleich et Hillenbrand, 2009), des variables météorologiques, y compris les précipitations et la température (Brown, Foti et Ramirez, 2013; Guo et coll., 2013; Heyn et Winsor, 2015; Worland, Steinschneider et Hornberger, 2018) et des prédicteurs socioéconomiques (Babel, Gupta et Pradhan, 2007; Sanchez et coll., 2020; Sun et coll., 2019). Une autre étude comparable (Sanchez et coll., 2020) a permis d’examiner deux États américains qui connaissent une croissance rapide, soit la Caroline du Nord et la Caroline du Sud, en utilisant un modèle de régression géographiquement pondérée pour analyser l’interaction entre les facteurs socioéconomiques, les variables environnementales et les configurations du paysage.
Alors que certaines études portent principalement sur les centres urbains et les mégapoles (Babel et coll., 2007; Chu et coll., 2009; Gharabaghi, Stahl et Bonakdari, 2019; Liu, Savic et Fu, 2023; Yurdusev et Firat, 2009; Zubaidi et coll., 2022), d’autres se limitent aux régions rurales (Keshavarzi et coll., 2006; Singh et Turkiya, 2013) et à une seule saison ou année (Machingambi et Manzungu, 2003; Makoni, Manase et Ndamba, 2004; Nyong et Kanaroglou, 2001).
Malgré cette littérature abondante, la disponibilité d’ensembles de données adéquats et la modélisation de la production d’eau potable à une échelle nationale et annuelle représentent un défi. Bien que certaines études aient eu pour but de simuler la consommation d’eau potable en fonction de la population et du revenu dans le cadre d’une évaluation à grande échelle, elles ne tenaient pas compte des variations saisonnières dans leur modélisation (Mitchell et Jones, 2005; Wada, Beek et Bierkens, 2011). L’échelle temporelle de la plupart de ces études était l’échelle annuelle (Makoni et coll., 2004) ou une échelle de temps beaucoup plus fine (p. ex. une résolution quotidienne ou horaire) (Herrera, et coll., 2010; Wong, Mui et Guan, 2010; Zhou et coll., 2000), sans inclure de variations trimestrielles. De plus, plusieurs études ont permis d’examiner les habitudes de consommation d’eau potable pendant la saison des pluies et la saison sèche, mais la portée de ces recherches se limitait à une région géographique particulière. Par conséquent, bon nombre des études antérieures dans la littérature présentent des limites en ce qui a trait à la période prise en compte, aux régions géographiques analysées ou à la quantité de données qui étaient disponibles.
À la connaissance des auteurs, il n’existe pas de technique commune en ce qui a trait au calcul des estimations de la production d’eau potable à l’échelle nationale au Canada. Par conséquent, le présent article comble une lacune dans la littérature en décrivant une méthodologie qui vise à modéliser la consommation d’eau potable à l’échelle nationale sur une base annuelle et trimestrielle pour la période allant de 2005 à 2019. Les résultats de cet exercice de modélisation sont également évalués. La prévision exacte de la demande en eau potable à long terme est un outil essentiel à la planification efficace à long terme et à l’agrandissement des installations de traitement de l’eau afin de répondre aux besoins futurs. En fournissant un aperçu des futures tendances de la demande, une telle prévision peut éclairer les processus décisionnels stratégiques et permettre aux autorités responsables de la gestion de l’eau d’allouer les ressources efficacement en anticipation de la demande future.
Le plan de l’article est le suivant : la section 2 présente les ensembles de données et la méthodologie qui ont permis de simuler le volume d’eau potable; la section 3 présente les résultats de l’application du modèle adéquat pour modéliser les années sans enquête, et la section 4 traite des résultats, des conclusions et des recommandations pour de futures études.
2 Ensembles de données et méthodologie
2.1 Sources des données
Les ensembles de données utilisés par Statistique Canada comprennent des estimations trimestrielles du produit intérieur brut (PIB) et de la population au 1er juillet dérivées des données du recensement (Statistique Canada, 2021a) ainsi que les estimations biennales de la population approvisionnée en eau potable pour les années 2005, 2006, 2007, 2011, 2013, 2015, 2017 et 2019 à l’échelle nationale (graphique 1; Statistique Canada, 2021b). Fondées sur l’ensemble de données sur le PIB disponible, qui fournissait uniquement des données trimestrielles à l’échelle nationale, toutes les modélisations et les comparaisons ont été effectuées à cette échelle temporelle.
Les données sur l’eau potable ont été tirées de l’Enquête biennale sur les usines de traitement de l’eau potable menée par Statistique Canada (Statistique Canada, 2021b). Cette enquête permet de recueillir des données biennales à l’échelle nationale et provinciale sur la production, la qualité et les coûts connexes de l’eau potable depuis 2005. L’enquête comprend les installations de traitement de l’eau potable qui fournissent de l’eau potable à diverses fins, comme l’utilisation résidentielle, commerciale, industrielle, institutionnelle et toute autre utilisation non résidentielle. L’enquête se concentre sur les usines de traitement de l’eau qui approvisionnent 300 personnes ou plus, et les sources d’eau comprennent l’eau souterraine, l’eau de surface et l’eau souterraine sous l’influence directe de l’eau de surface (ESSID) (Statistique Canada, 2011).
Selon les données de l’enquête, l’eau de surface représente un peu plus de 88 % de la production pour l’approvisionnement public, la partie restante de la production d’eau étant fournie par l’eau souterraine et l’ESSID. De 2011 à 2019, l’utilisation quotidienne moyenne de l’eau dans tous les secteurs, y compris les secteurs résidentiel et industriel, les pertes et le commerce de gros, a diminué pour passer de 485 litres par personne par jour à 411 litres par personne par jour. Cependant, la proportion de l’utilisation de l’eau potable dans le secteur résidentiel a augmenté pour passer de 43 % en 2011 à 51 % en 2019 (graphique 1).
L’utilisation de l’eau potable suit une tendance saisonnière, la consommation la plus élevée se produisant de juillet à septembre en raison de facteurs tels que le temps plus chaud, l’augmentation des activités de plein air, les vacances, le jardinage, les pertes d’eau par évaporation plus importantes et les habitudes d’hydratation individuelles, et la consommation la plus faible se produisant d’octobre à mars en raison du temps plus froid. Le graphique 2 montre la production mensuelle moyenne d’eau potable au Canada de 2005 à 2019.

Tableau de données du graphique 1
| Année | Population approvisionnée | Population | Production d'eau potable |
|---|---|---|---|
| milliers | millions de mètres cubes | ||
| Sources : Statistique Canada. Tableau 38-10-0092-01 Volumes d'eau potable traités par les usines de traitement de l'eau potable, selon le type de source d'eau (x 1 000 000). Tableau 38-10-0093-01 Population approvisionnée par les usines de traitement de l'eau potable. Tableau 17-10-0005-01 Estimations de la population au 1er juillet, par âge et genre. | |||
| 2005 | 27 309 | 32 243 | 5 706,2 |
| 2006 | 27 564 | 32 571 | 5 561,1 |
| 2007 | 27 968 | 32 889 | 5 616,8 |
| 2011 | 28 971 | 34 339 | 5 123,7 |
| 2013 | 29 986 | 35 081 | 5 032,8 |
| 2015 | 30 809 | 35 704 | 5 020,8 |
| 2017 | 31 346 | 36 545 | 4 882,3 |
| 2019 | 32 447 | 37 618 | 4 864,0 |

Tableau de données du graphique 2
| 2005 | 2006 | 2007 | 2011 | 2013 | 2015 | 2017 | 2019 | |
|---|---|---|---|---|---|---|---|---|
| millions de mètres cubes | ||||||||
| Note : Afin d'assurer l'accessibilité pour tous les utilisateurs, les données sont présentées dans deux graphiques.
Sources : Statistique Canada. Tableau 38-10-0272-01 Volumes d'eau potable traités par les usines de traitement de l'eau potable, selon le mois (x 1 000 000). |
||||||||
| janvier à mars | 1 284,7 | 1 251,4 | 1 266,3 | 1 177,2 | 1 151,0 | 1 158,8 | 1 102,2 | 1 119,3 |
| avril à juin | 1 456,2 | 1 427,3 | 1 449,8 | 1 284,8 | 1 274,7 | 1 330,5 | 1 228,7 | 1 250,7 |
| juillet à septembre | 1 653,0 | 1 613,5 | 1 621,9 | 1 482,5 | 1 439,1 | 1 402,6 | 1 433,3 | 1 378,8 |
| octobre à décembre | 1 312,1 | 1 269,2 | 1 278,1 | 1 179,1 | 1 168,1 | 1 128,9 | 1 124,3 | 1 117,2 |
2.2 Méthodologie utilisée pour la production d’eau potable
La recherche menée aux fins du présent article a permis de déterminer que les modèles de régression représentent une méthodologie pour examiner la relation entre une variable dépendante, y, et un ensemble de variables auxiliaires, x, dans la prédiction des habitudes d’utilisation de l’eau potable par l’intégration de multiples facteurs explicatifs. Ces facteurs comprennent des variables démographiques telles que la taille de population et des prédicateurs socioéconomiques, comme le PIB.
Des méthodes de prévision sophistiquées faisant appel à des modèles de séries chronologiques, y compris la régression linéaire multiple (RLM), la forêt aléatoire (FA), la régression spline (RS) et la régression par les moindres carrés partiels (MCP), ont été examinées. Cette section présente quatre méthodes distinctes utilisées pour modéliser l’utilisation de l’eau potable afin de prédire la quantité annuelle d’eau potable produite par les usines de traitement de l’eau. Le langage de programmation R a été utilisé pour l’ajustement et la validation du modèle.
2.2.1 Régression linéaire multiple
Un modèle de RLM a été utilisé pour comparer les prévisions faites par les modèles de prédiction. Ce modèle effectue une régression de l’utilisation trimestrielle de l’eau potable en fonction des prédicteurs trimestriels de population et du PIB ainsi que de leurs interactions. Le critère d’information d’Akaike a été utilisé pour effectuer une sélection du modèle et éliminer les interactions non significatives (Friedman et coll., 2001). Le modèle est défini par l’équation suivante :
où représente la production d’eau potable calculée en fonction de , qui est le je prédicteur pour le ie trimestre, où α représente le vecteur des coefficients de régression ( = , ,..) et où et ϵ représentent un terme constant et un terme d’erreur, respectivement.
2.2.2 Forêt aléatoire
FA est un algorithme d’apprentissage supervisé non paramétrique qui comprend plusieurs arbres de décision (Breiman, 2001). Cette méthode est conçue à partir d’un nombre fixe d’arbres (), chacun étant entraîné au moyen d’un sous-échantillon bootstrap différent de données d’entraînement.
Afin d’éviter qu’un arbre ou qu’une variable ne domine le modèle, un sous-ensemble aléatoire de m covariables est utilisé pour la partition à chaque étape de la croissance de l’arbre. Ce processus de sélection garantit que l’ensemble n’est pas dominé par des arbres dominants et qu’une vaste gamme d’arbres possibles sont examinés. Les valeurs optimales de et de m sont des paramètres de réglage déterminés en fonction d’un équilibre entre les coûts de calcul de l’ajustement des modèles d’arbres supplémentaires et l’amélioration de l’exactitude qui en résulte. Pour générer des prédictions à partir d’un modèle de forêt aléatoire, de nouvelles données sont versées dans chaque arbre de décision, et une moyenne des résultats de tous les nœuds terminaux est calculée afin de produire une prédiction pour chaque nouvelle observation comme suit :
Le progiciel en Random Forest (Liaw et Wiener, 2002) a été utilisé pour la modélisation.
2.2.3 Régression par les moindres carrés partiels
La technique de régression par les MCP repose sur un modèle prédictif construit standard utilisé en présence de variables explicatives fortement colinéaires (Quenouille, 1949). Selon cette technique, la relation entre une matrice de variables explicatives () et la variable de réponse () est expliquée par des variables latentes ou scores (Ƭ). Les scores peuvent expliquer la variabilité maximale à la fois dans et dans . Les équations sont les suivantes :
où et sont la matrice de scores et la matrice de charge, et ε est la matrice des résidus .
peut aussi être calculé à l’aide de la matrice de poids MCP transformés comme ci-dessous :
Finalement, la réponse () est calculée à l’aide de la matrice de poids () et les résidus connexes ().
2.2.4 Régression spline
La RS cubique est une régression polynomiale par morceaux non paramétrique qui ajuste des polynômes de faible degré distincts sur différentes périodes de la courbe d’utilisation de l’eau potable. La courbe est divisée en k+1 segments par k points d’arrêt, aussi appelés nœuds.
Dans le cadre de l’étude, la méthode de validation croisée par exclusion d’un élément a été employée pour évaluer le rendement des modèles prédictifs. Cette approche consiste à mettre de côté une observation de l’ensemble de données et à calculer l’estimation de l’erreur des points de données restants. Le modèle a été entraîné à partir de tous les points de données, sauf une donnée d’une année, et validé par la suite avec le point de données de cette année-là en utilisant le schéma de validation croisée. Ce processus a été répété pour toutes les combinaisons de données possibles.
2.3 Analyse statistique
Le meilleur modèle a été sélectionné à partir des méthodes ci-dessus en fonction de la somme de l’estimation des erreurs au carré (SEC) la plus faible et de l’erreur moyenne absolue (EMA).
où
= nombre de la taille de l’échantillon,
= production d’eau de l’enquête,
= production d’eau prédite.
Les techniques expliquées ont été appliquées et comparées dans la section suivante.
3 Résultats et discussion
Le tableau 1 de cette étude présente en détail l’évaluation de huit exécutions de validation croisée de quatre modèles (FA, RLM, MCP et RS) menées à l’échelle nationale sur une base trimestrielle. L’analyse de l’exactitude prédictive pour toutes les méthodes statistiques indique que le modèle de régression spline présente systématiquement la SEC totale la plus faible et une EMA d’environ 1 % au cours des années de validation. Par conséquent, la présente étude laisse supposer que la RS s’avère une technique de modélisation plus appropriée pour les données sur l’eau potable, dont l’excellence est attribuable à sa capacité à saisir les relations non linéaires et à traiter efficacement les schémas complexes dans les données sur l’eau potable, une conclusion qui correspond aux constatations de Rinaudo (2015).
Grâce à cet excellent rendement, une analyse du rendement du modèle de RS a été effectuée à l’échelle annuelle, ce qui a démontré une baisse du rendement d’environ 28 % comparativement à l’échelle trimestrielle. Le rendement plus faible pourrait être attribuable au manque de données suffisantes à l’échelle annuelle pour correspondre exactement à un modèle de RS.
En revanche, le modèle de MCP a présenté la SEC totale la plus élevée pour l’ensemble des années de validation allant de 2005 à 2019, totalisant environ 142 930 millions de mètres cubes au carré ((MMC)2). Ce chiffre était nettement plus élevé que les valeurs de la SEC pour les autres techniques : 83 408 (MMC)2 pour les FA, 75 509 (MMC)2 pour la RLM et 34 116 (MMC)2 pour la RS. De plus, le modèle de MCP a affiché une EMA de 4 %, ce qui indique une exactitude prédictive plus faible comparativement aux modèles de FA, de RLM et de RS, qui ont obtenu des valeurs d’EMA de 2 %, de 1 % et de 1 %, respectivement. Ces résultats laissent supposer que le modèle de MCP pourrait nécessiter plus de variables auxiliaires pour améliorer son rendement (Quenouille, 1949). De plus, le rendement plus faible du modèle de FA pourrait être attribuable à sa sensibilité à la caractéristique de taille d’échantillon limitée de ce type de données, comme l’indiquent des études antérieures (Sultana et coll., 2018).
Le graphique 3 montre la production trimestrielle d’eau potable par les usines de traitement de l’eau modélisée par différentes techniques pour la période allant de 2005 à 2019. Selon les estimations modélisées, la période de juillet à septembre affichait les valeurs de production d’eau potable les plus élevées, tandis que les mois d’octobre à février affichaient la production d’eau potable la plus faible comparativement aux mois restants. Cependant, les résultats obtenus à partir du modèle à l’échelle mensuelle n’ont pas été corroborés en raison de la non-disponibilité de données supplémentaires pendant l’étude, ce qui a nui au processus de validation.
Il convient de noter que les éléments météorologiques et les répercussions des changements climatiques ont le potentiel de modifier la tendance de la demande d’eau potable (Gober, 2010; Milly et coll., 2008). Cette observation souligne la complexité des facteurs ayant une incidence sur la production et la consommation d’eau. Fait important, ces conclusions devraient être interprétées à la lumière de certaines limites de la présente étude. Le manque de données supplémentaires pour le modèle à l’échelle mensuelle est l’une de ces limites qui entravent la validation rigoureuse des résultats. De plus, il est essentiel de reconnaître que cette analyse ne pouvait pas tenir compte de toutes les variables possibles ayant une incidence sur la production d’eau potable.

Tableau de données du graphique 3
| Observée | a: Régression spline (RS) | b: Forêt aléatoire (FA) | c: Régression linéaire multiple(RLM) | d: Régression par les moindres carrés partiels (MCP) | |
|---|---|---|---|---|---|
| millions de mètres cubes | |||||
| Source : Calculs des auteurs. | |||||
| 2005 | |||||
| Trimestre 1 | 1 284,7 | 1 314,6 | 1 258,4 | 1 275,8 | 1 348,8 |
| Trimestre 2 | 1 456,2 | 1 312,9 | 1 295,8 | 1 392,3 | 1 394,9 |
| Trimestre 3 | 1 653,0 | 1 584,8 | 1 554,0 | 1 572,5 | 1 574,2 |
| Trimestre 4 | 1 312,1 | 1 491,5 | 1 439,6 | 1 281,9 | 1 240,6 |
| 2006 | |||||
| Trimestre 1 | 1 251,4 | 1 299,8 | 1 319,4 | 1 305,4 | 1 342,3 |
| Trimestre 2 | 1 427,3 | 1 298,0 | 1 304,2 | 1 392,6 | 1 388,0 |
| Trimestre 3 | 1 613,5 | 1 575,1 | 1 576,9 | 1 585,1 | 1 571,3 |
| Trimestre 4 | 1 269,2 | 1 469,2 | 1 481,1 | 1 310,0 | 1 238,8 |
| 2007 | |||||
| Trimestre 1 | 1 266,3 | 1 263,8 | 1 282,7 | 1 270,2 | 1 321,2 |
| Trimestre 2 | 1 449,8 | 1 264,2 | 1 285,0 | 1 360,9 | 1 364,5 |
| Trimestre 3 | 1 621,9 | 1 544,4 | 1 559,5 | 1 578,7 | 1 548,8 |
| Trimestre 4 | 1 278,1 | 1 429,4 | 1 466,0 | 1 278,0 | 1 217,5 |
| 2011 | |||||
| Trimestre 1 | 1 177,2 | 1 181,6 | 1 167,5 | 1 204,2 | 1 284,5 |
| Trimestre 2 | 1 284,8 | 1 188,8 | 1 187,7 | 1 331,1 | 1 336,7 |
| Trimestre 3 | 1 482,5 | 1 469,2 | 1 453,9 | 1 481,8 | 1 515,0 |
| Trimestre 4 | 1 179,1 | 1 362,2 | 1 364,3 | 1 190,5 | 1 174,4 |
| 2013 | |||||
| Trimestre 1 | 1 151,0 | 1 144,3 | 1 152,7 | 1 190,5 | 1 252,7 |
| Trimestre 2 | 1 274,7 | 1 153,2 | 1 171,2 | 1 296,9 | 1 301,6 |
| Trimestre 3 | 1 439,1 | 1 435,0 | 1 447,5 | 1 440,6 | 1 485,5 |
| Trimestre 4 | 1 168,1 | 1 325,5 | 1 331,0 | 1 191,7 | 1 140,0 |
| 2015 | |||||
| Trimestre 1 | 1 158,8 | 1 114,2 | 1 145,4 | 1 158,3 | 1 217,0 |
| Trimestre 2 | 1 330,5 | 1 136,4 | 1 144,8 | 1 250,1 | 1 258,8 |
| Trimestre 3 | 1 402,6 | 1 423,1 | 1 439,9 | 1 444,4 | 1 459,8 |
| Trimestre 4 | 1 128,9 | 1 283,8 | 1 304,1 | 1 151,5 | 1 116,1 |
| 2017 | |||||
| Trimestre 1 | 1 102,2 | 1 108,5 | 1 116,3 | 1 139,4 | 1 190,7 |
| Trimestre 2 | 1 228,7 | 1 122,4 | 1 125,1 | 1 278,2 | 1 239,4 |
| Trimestre 3 | 1 433,3 | 1 398,7 | 1 404,0 | 1 428,2 | 1 417,9 |
| Trimestre 4 | 1 124,3 | 1 288,7 | 1 306,3 | 1 133,0 | 1 077,8 |
| 2019 | |||||
| Trimestre 1 | 1 119,3 | 1 081,3 | 1 059,7 | 1 126,4 | 1 128,9 |
| Trimestre 2 | 1 250,7 | 1 095,7 | 1 053,2 | 1 257,8 | 1 172,0 |
| Trimestre 3 | 1 378,8 | 1 353,7 | 1 345,5 | 1 447,5 | 1 362,9 |
| Trimestre 4 | 1 117,2 | 1 283,7 | 1 252,8 | 1 129,0 | 1 015,5 |
| Modèle de régression | Échelle temporelle | Années de calibration | Année de validation | Mesures statistiques | ||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 2005 | 2006 | 2007 | 2011 | 2013 | 2015 | 2017 | 2019 | SEC | EMA | |||
| (MMC)2 | pourcentage | |||||||||||
|
Notes : SEC : somme de l’estimation des erreurs au carré; EMA : erreur moyenne absolue; MCP : moindres carrés partiels; RLM : régression linéaire multiple; FA : forêt aléatoire. Un point (●) pour une année indique que l’année en question a été utilisée dans la modélisation
Source : Calculs des auteurs 98 |
||||||||||||
| Régression spline | Trimestrielle | ● | ● | ● | ● | ● | ● | ● | 2005 | 6,14 | 0 | |
| ● | ● | ● | ● | ● | ● | ● | 2006 | 6 559,06 | 1 | |||
| ● | ● | ● | ● | ● | ● | ● | 2007 | 13 228,22 | 2 | |||
| ● | ● | ● | ● | ● | ● | ● | 2011 | 6 109,92 | 2 | |||
| ● | ● | ● | ● | ● | ● | ● | 2013 | 632,47 | 0 | |||
| ● | ● | ● | ● | ● | ● | ● | 2015 | 4 006,76 | 1 | |||
| ● | ● | ● | ● | ● | ● | ● | 2017 | 900,18 | 1 | |||
| ● | ● | ● | ● | ● | ● | ● | 2019 | 2 672,89 | 1 | |||
| Annuelle | ● | ● | ● | ● | ● | ● | ● | 2005 | 595,56 | 0 | ||
| ● | ● | ● | ● | ● | ● | ● | 2006 | 6 819,17 | 1 | |||
| ● | ● | ● | ● | ● | ● | ● | 2007 | 18 453,44 | 2 | |||
| ● | ● | ● | ● | ● | ● | ● | 2011 | 11 783,17 | 2 | |||
| ● | ● | ● | ● | ● | ● | ● | 2013 | 343,46 | 0 | |||
| ● | ● | ● | ● | ● | ● | ● | 2015 | 8 562,66 | 2 | |||
| ● | ● | ● | ● | ● | ● | ● | 2017 | 606,60 | 1 | |||
| ● | ● | ● | ● | ● | ● | ● | 2019 | 6,22 | 0 | |||
| Régression par les moindres carrés partiels | Trimestrielle | ● | ● | ● | ● | ● | ● | ● | 2005 | 21 775,96 | 8 | |
| ● | ● | ● | ● | ● | ● | ● | 2006 | 438,97 | 0 | |||
| ● | ● | ● | ● | ● | ● | ● | 2007 | 26 933,67 | 1 | |||
| ● | ● | ● | ● | ● | ● | ● | 2011 | 34 980,42 | 1 | |||
| ● | ● | ● | ● | ● | ● | ● | 2013 | 21 585,32 | 11 | |||
| ● | ● | ● | ● | ● | ● | ● | 2015 | 949,87 | 0 | |||
| ● | ● | ● | ● | ● | ● | ● | 2017 | 1 388,54 | 1 | |||
| ● | ● | ● | ● | ● | ● | ● | 2019 | 34 877,61 | 6 | |||
| Régression linéaire multiple | Trimestrielle | ● | ● | ● | ● | ● | ● | ● | 2005 | 25 042,88 | 3 | |
| ● | ● | ● | ● | ● | ● | ● | 2006 | 14 462,65 | 2 | |||
| ● | ● | ● | ● | ● | ● | ● | 2007 | 525,17 | 0 | |||
| ● | ● | ● | ● | ● | ● | ● | 2011 | 2 482,49 | 1 | |||
| ● | ● | ● | ● | ● | ● | ● | 2013 | 4 832,85 | 1 | |||
| ● | ● | ● | ● | ● | ● | ● | 2015 | 179,48 | 0 | |||
| ● | ● | ● | ● | ● | ● | ● | 2017 | 3 999,74 | 1 | |||
| ● | ● | ● | ● | ● | ● | ● | 2019 | 23 984,03 | 3 | |||
| Forêt aléatoire | Trimestrielle | ● | ● | ● | ● | ● | ● | ● | 2005 | 33 757,28 | 3 | |
| ● | ● | ● | ● | ● | ● | ● | 2006 | 1 022,61 | 1 | |||
| ● | ● | ● | ● | ● | ● | ● | 2007 | 16 648,88 | 2 | |||
| ● | ● | ● | ● | ● | ● | ● | 2011 | 7 033,92 | 2 | |||
| ● | ● | ● | ● | ● | ● | ● | 2013 | 7 539,31 | 2 | |||
| ● | ● | ● | ● | ● | ● | ● | 2015 | 270,77 | 0 | |||
| ● | ● | ● | ● | ● | ● | ● | 2017 | 8 190,35 | 2 | |||
| ● | ● | ● | ● | ● | ● | ● | 2019 | 8 944,86 | 2 | |||
4 Conclusion
Dans la présente étude, quatre techniques ont été utilisées pour estimer l’utilisation de l’eau potable à l’échelle nationale au Canada sur une base trimestrielle. Le modèle de RS a été recommandé pour quantifier la série chronologique continue de l’utilisation de l’eau potable. Plus précisément, cette approche peut servir à combler les lacunes statistiques pour la période allant de 2005 à 2019, durant laquelle aucune donnée sur l’eau potable n’a été recueillie dans le cadre de l’Enquête biennale sur les usines de traitement de l’eau potable. Bien que la méthode de régression spline a été la meilleure dans l’ensemble, elle s’est avérée moins performante pour estimer les données annuelles sur l’eau potable que pour estimer les données sur une échelle trimestrielle.
Les limites de l’analyse actuelle, telles que l’absence de données supplémentaires pour le modèle à l’échelle mensuelle et l’oubli possible de diverses variables, font ressortir la nécessité de mener d’autres recherches sur lesquelles s’appuyer et qui permettront d’approfondir les connaissances acquises par l’entremise de cette analyse. Les recherches futures devraient donner la priorité à la résolution de ces limites et viser une compréhension plus complète de la dynamique qui influence l’approvisionnement en eau. Si de futurs travaux de recherche parviennent à surmonter ces défis, ils pourront jouer un rôle essentiel dans l’amélioration de l’exactitude et de l’applicabilité des modèles, et contribuer au bout du compte à une estimation plus précise et plus complexe des facteurs ayant une incidence sur la production d’eau potable.
Remerciements : Nous remercions sincèrement Beni Ngabo Nsengiyaremye et Martin Hamel de leurs contributions inestimables à titre de consultants. Nous remercions tout particulièrement Jennie Wang, Jessica Andrews, Terence Nelligan, Jenny Watt et Avani Babooram de leur révision et de leurs commentaires, qui ont permis d’améliorer grandement la qualité de cet article. Nous sommes profondément reconnaissants de leur collaboration et de leur soutien.
Références
Babel, M. S., A. D. Gupta et P. Pradhan. (2007). « A multivariate econometric approach for domestic water demand modeling: An application to Kathmandu, Nepal », Water Resources Management, vol. 21, p. 573 à 589.
Breiman, L. (2001). « Random forests », Machine Learning, vol. 45, p. 5 à 32.
Brown, T. C., R. Foti et J. A. Ramirez. (2013). « Projected freshwater withdrawals in the United States under a changing climate », Water Resources Research, vol. 49, no 3, p. 1259 à 1276.
Chu, J., C. Wang, J. Chen et H. Wang. (2009). « Agent-based residential water use behavior simulation and policy implications: A case-study in Beijing city », Water Resources Management, vol. 23, p. 3267 à 3295.
Friedman, J., T. Hastie et R. Tibshirani. (2001). The elements of statistical learning: Data mining, inference, and prediction, vol. 1, Springer. 10.1007/978-0-387-21606-5
Gharabaghi, S., E. Stahl et H. Bonakdari. (2019). « Integrated nonlinear daily water demand forecast model (case study: City of guelph, canada) » Journal of Hydrology, vol. 579, p. 124182. doi:10.1016/j.jhydrol.2019.124182
Gober, P. (2010). « Desert urbanization and the challenges of water sustainability », Current Opinion in Environmental Sustainability, vol. 2, no 3, p. 144 à 150.
Guo, B., Y. Chen, Y. Shen, W. Li et C. Wu. (2013). « Spatially explicit estimation of domestic water use in the arid region of northwestern China: 1985–2009 », Hydrological Sciences Journal, vol. 58, no 1, p. 162 à 176. doi:10.1080/02626667.2012.745081
Herrera, M., L. Torgo, J. Izquierdo et R. Pérez-García. (2010). « Predictive models for forecasting hourly urban water demand », Journal of Hydrology (Amsterdam), vol. 387, no 1, p. 141 à 150. doi:10.1016/j.jhydrol.2010.04.005
Heyn, K. et W. Winsor. (2015). Climate risks to water utility built assets and infrastructure,Portland, Portland Water Bureau.
Keshavarzi, A. R., M. Sharifzadeh, A. K. Haghighi, S. Amin, S. Keshtkar et A. Bamdad. (2006). « Rural domestic water consumption behavior: A case study in Ramjerd area, Fars province, IR Iran », Water Research, vol. 40, no 6, p. 1173 à 1178.
Liaw, A. et M. Wiener. (2002). « Classification and regression by Random Forest », R News, vol. 2, no 3, p. 18 à 22.
Liu, G., D. Savic et G. Fu. (2023). « Short-term water demand forecasting using data-centric machine learning approaches », Journal of Hydroinformatics, vol. 25, no 3, p. 895 à 911. doi:10.2166/hydro.2023.163.
Machingambi, M. et E. Manzungu. (2003). « An evaluation of rural communities’ water use patterns and preparedness to manage domestic water sources in Zimbabwe », Physics and Chemistry of the Earth, Parts A/B/C, vol. 28, nos 20 à 27, p. 1039 à 1046.
Makoni, F. S., G. Manase et J. Ndamba. (2004). « Patterns of domestic water use in rural areas of Zimbabwe, gender roles and realities », Physics and Chemistry of the Earth, Parts A/B/C, vol. 29, nos 15 à 18, p. 1291 à 1294.
Milly, P. C., J. Betancourt, M. Falkenmark, R. M. Hirsch, Z. W. Kundzewicz, D. P. Lettenmaier et R. J. Stouffer (2008). « Stationarity is dead: Whither water management? », Science, vol. 319, no 5863, p. 573 à 574.
Mitchell, T. D. et P. D. Jones. (2005). « An improved method of constructing a database of monthly climate observations and associated high‐resolution grids », International Journal of Climatology: A Journal of the Royal Meteorological Society, vol. 25, no 6, p. 693 à 712.
Nyong, A. O. et P. S. Kanaroglou. (2001). « A survey of household domestic water-use patterns in rural semi-arid Nigeria », Journal of Arid Environments, vol. 49, no 2, p. 387 à 400.
Quenouille, M. H. (1949). « Approximate Tests of Correlation in Time-Series », Journal of the Royal Statistical Society. Series B (Methodological), vol. 11, no 1, p. 68 à 84. http://www.jstor.org/stable/2983696
Rinaudo, J.-D. (2015). « Long-term water demand forecasting », Springer Netherlands. Understanding and managing urban water in transition, p. 239 à 268. doi:10.1007/978-94-017-9801-3_11
Ryan, S. et J. Wang. (2012). Residential water metering and pricing structures for the District of Mission [mémoire de maîtrise, Université de Victoria].
Sanchez, G. M., A. Terando, J. W. Smith, A. M. García, C. R. Wagner et R. K. Meentemeyer. (2020). « Forecasting water demand across a rapidly urbanizing region », Science of the Total Environment, vol. 730, p. 139050.
Schleich, J. et T. Hillenbrand. (2009). « Determinants of residential water demand in Germany », Ecological Economics, vol. 68, no 6, p. 1756 à 1769. doi:10.1016/j.ecolecon.2008.11.012
Singh, O., & Turkiya, S. (2013). A survey of household domestic water consumption patterns in rural semi-arid village, India. GeoJournal, 78, 777-790.
Smeti, E. M., N. C. Thanasoulias, E. S. Lytras, P. C. Tzoumerkas et S. K. Golfinopoulos (2009). « Treated water quality assurance and description of distribution networks by multivariate chemometrics », Water Research, vol. 43, no 18, p. 4676 à 4684. doi:10.1016/j.watres.2009.07.023
Statistique Canada. (2011). Enquête sur les usines de traitement de l’eau potable Survey of drinking water plants. Consultée le 12 janvier 2022.
Statistique Canada. (2021a). Tableau 36-10-0449-01 Produit intérieur brut (PIB) aux prix de base, par industrie, moyenne trimestrielle. Consulté le 12 octobre 2022.
Statistique Canada. (2021b). Tableau 38-10-0271-01 Utilisation d’eau potable selon le secteur et utilisation quotidienne moyenne. Consulté le 12 octobre 2022.
Sultana, Z., T. Sieg, P. Kellermann, M. Müller et H. Kreibich. (2018). « Assessment of business interruption of flood-affected companies using random forests », Water, vol. 10, no 8, p.1049.
Sun, S., G. Fu, C. Bao et C. Fang. (2019). « Identifying hydro-climatic and socioeconomic forces of water scarcity through structural decomposition analysis: A case study of Beijing city », Science of the Total Environment, vol. 687, p. 590 à 600.
Wada, Y., L. P. H. van Beek et M. F. P. Bierkens. (2011). « Modelling global water stress of the recent past: On the relative importance of trends in water demand and climate variability », Hydrology and Earth System Sciences, vol. 15, no 12, p. 3785 à 3808. doi:10.5194/hess-15-3785-2011
Wong, L. T., K. W. Mui et Y. Guan. (2010). « Shower water heat recovery in high-rise residential buildings of Hong Kong », Applied Energy, vol. 87, no 2, p. 703 à 709.
Worland, S. C., S. Steinschneider et G. M. Hornberger. (2018). Drivers of variability in Public‐Supply water use across the contiguous United States, American Geophysical Union (AGU). doi:10.1002/2017wr021268
Yurdusev, M. A. et M. Firat. (2009). « Adaptive neuro fuzzy inference system approach for municipal water consumption modeling: An application to Izmir, Turkey », Journal of Hydrology, vol. 365, nos 3 et 4, p. 225 à 234.
Zhou, S. L., T. A. McMahon, A. Walton et J. Lewis. (2000). « Forecasting daily urban water demand: A case study of Melbourne », Journal of Hydrology, vol. 236, nos 3 et 4, p. 153 à 164.
Zubaidi, S. L., K. Hashim, S. Ethaib, N. S. S. Al-Bdairi, H. Al-Bugharbee et S. K. Gharghan. (2022). « A novel methodology to predict monthly municipal water demand based on weather variables scenario », Journal of King Saud University – Engineering Sciences, vol. 34, no 3, p. 163 à 169. doi:10.1016/j.jksues.2020.09.011
- Date de modification :