Statistique Canada
Symbole du gouvernement du Canada

Liens de la barre de menu commune

Menu de navigation du site

Analyse de sensibilité

Avertissement Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Méthodologie
Analyse de l'indice en fonction du nombre de paramètres
Analyse de l'indice en fonction du nombre d'échantillons
Analyse de la contribution des termes de l'indice
Analyse de la corrélation entre les termes de l'indice
Analyse de l'indice en utilisant trois échantillons au lieu de quatre
Analyse de la variabilité de l'indice à l'intérieur des stations
Analyse de l'indice en tenant compte de la saison

Dans ce chapitre, nous réaliserons une analyse de sensibilité afin de comprendre et d'expliquer le comportement de l'indice en raison : a) de sa complexité; b) que les provinces n'utilisent pas nécessairement le même nombre de paramètres et d'échantillons dans leur calcul et c) que le prélèvement de ces échantillons ne se fait pas à la même période (date).

Nous débuterons en décrivant la méthodologie sous-jacente à la réalisation de cette analyse. Ensuite, nous observerons le comportement de l'indice lorsque nous augmentons le nombre a) de paramètres et b) d'échantillons; c) la contribution de chacun des termes ainsi que la corrélation entre les termes dans le calcul de l'indice; d) si l'utilisation de trois échantillons au lieu de quatre par année influence les résultats de l'indice; e) la variabilité de l'indice à l'intérieur des stations; et f) le comportement de l'indice lorsque nous tenons compte de la saison.

Méthodologie

La procédure que nous utiliserons jusqu'à la section Résultats de l'indice en utilisant trois et quatre échantillons inclusivement pour chaque ensemble de données est la suivante :

  1. Nous attribuons un nombre aléatoire à chaque échantillon en utilisant une loi uniforme.
  2. Nous ordonnons en ordre croissant les échantillons en fonction du nombre aléatoire par station et par année.
  3. Nous réalisons toutes les combinaisons possibles de x paramètres parmi le nombre total de paramètres. Pour chacune de ces combinaisons :
    1. Nous sélectionnons toutes les séquences de y échantillons consécutifs sans répétition des échantillons à l'intérieur d'une station et d'une année.
    2. Nous regroupons les y échantillons de trois années consécutives.
    3. Nous calculons les termes F1, F2 et F3 ainsi que l'indice lui-même basé sur les trois années consécutives.
  4. Nous analysons les résultats pour un nombre de paramètres et d'échantillons donnés.

Analyse de l'indice en fonction du nombre de paramètres

Dans cette section, nous analyserons pour chacun des ensembles de données le comportement de l'indice lorsque nous augmentons le nombre de paramètres sélectionnés pour un nombre donné d'échantillons afin de regarder si le nombre de paramètres a un impact dans le calcul de l'indice.

Graphique 9 Comportement de l'indice en fonction du nombre de paramètres pour l'ensemble de données de Terre-Neuve-et-Labrador. Une nouvelle fenêtre s'ouvrira.

Graphique 9
Comportement de l'indice en fonction du nombre de paramètres pour l'ensemble de données de Terre-Neuve-et-Labrador

Observations : Ce graphique nous apprend que plus le nombre de paramètres sélectionnés augmente pour un nombre donné d'échantillons, plus les catégories extrêmes (« mauvaise » et « excellente ») ainsi que la catégorie « bonne » perdent leur intensité au profit des catégories « médiocre » et « moyenne ». Regardons plus spécifiquement le cas de quatre échantillons : Le pourcentage cumulé des catégories « excellente » et « bonne » diminue de 26,2 % à 12 % tandis qu'il augmente de 51,1 % à 83 % pour les catégories « médiocre » et « moyenne » lorsque nous prenons dix paramètres au lieu de quatre dans le calcul de l'indice. De plus, le pourcentage de la catégorie « mauvaise » passe de 18,7 % à 4,4 %.

Graphique 10 Comportement de l'indice en fonction du nombre de paramètres pour l'ensemble de données de l'Ontario. Une nouvelle fenêtre s'ouvrira.

Graphique 10
Comportement de l'indice en fonction du nombre de paramètres pour l'ensemble de données de l'Ontario

Observations : Ce graphique permet de constater que plus le nombre de paramètres sélectionnés augmente pour un nombre donné d'échantillons, plus le pourcentage des catégories extrêmes (« mauvaise » et « excellente ») diminue au profit de la catégorie « moyenne ». Par ailleurs, en sélectionnant dix échantillons et plus par année, le pourcentage de la catégorie « bonne » descend à mesure que nous augmentons le nombre de paramètres. Regardons maintenant le cas de dix échantillons : Le pourcentage cumulé des catégories « excellente » et « bonne » baisse de 29,1 % à 10,6 % lorsque nous prenons 14 paramètres au lieu de 4 dans le calcul de l'indice. De plus, le pourcentage de la catégorie « mauvaise » passe de 12,4 % à 4,5 % comparativement à la catégorie « moyenne » dont le pourcentage grimpe de 26,9 % à 50 %.

Graphique 11 Comportement de l'indice en fonction du nombre de paramètres pour l'ensemble de données de la Colombie-Britannique. Une nouvelle fenêtre s'ouvrira.

Graphique 11
Comportement de l'indice en fonction du nombre de paramètres pour l'ensemble de données de la Colombie-Britannique

Observations : Plus le nombre de paramètres sélectionnés augmente pour un nombre donné d'échantillons, plus les catégories extrêmes (« mauvaise » et « excellente ») perdent leur intensité au profit d'un mixte des trois autres catégories. Regardons le cas de huit échantillons : Le pourcentage des catégories « excellente » et « mauvaise » descend de 13,5 % à 0 % et de 4,8 % à 0 % respectivement lorsque nous prenons huit paramètres au lieu de quatre dans le calcul de l'indice comparativement aux catégories « moyenne » et « bonne » dont le pourcentage cumulé augmente de 50,0 % à 73,3 %.

Graphique 12 Comportement de l'indice en fonction du nombre de paramètres pour l'ensemble de données du Québec. Une nouvelle fenêtre s'ouvrira.

Graphique 12
Comportement de l'indice en fonction du nombre de paramètres pour l'ensemble de données du Québec

Observations : Encore une fois, plus le nombre de paramètres sélectionnés augmente pour un nombre donné d'échantillons, plus le pourcentage des catégories extrêmes (« mauvaise » et « excellente ») diminue au profit de la catégorie « moyenne ». Regardons plus spécifiquement le cas de six échantillons : Le pourcentage des catégories « excellente » et « mauvaise » baisse de 18,4 % à 9,4 % et de 8,9 % à 6,3 % respectivement lorsque nous prenons six paramètres au lieu de quatre dans le calcul de l'indice comparativement à la catégorie « moyenne » dont son pourcentage grimpe de 27,7 % à 43,8 %.

Discussion : Les quatre derniers graphiques nous indiquent que l'indice est sensible au nombre de paramètres entrant dans le calcul. En effet, plus nous augmentons le nombre de paramètres, plus les catégories extrêmes (« mauvaise » et « excellente ») perdent de leur intensité au profit des catégories « médiocre » et « moyenne » et ce, peu importe leur point de départ. Ceci peut s'expliquer par le fait qu'en augmentant le nombre de paramètres dans le calcul de l'indice, le dénominateur du premier terme est plus élevé qui aura pour effet de diminuer la valeur du premier terme. Aussi, nous augmentons le nombre total de résultats analytiques à analyser qui augmentera la probabilité d'avoir un résultat non-conforme et aura des répercussions sur le calcul des termes de l'indice.

Analyse de l'indice en fonction du nombre d'échantillons

Maintenant, nous regarderons le comportement de l'indice pour chacun des ensembles de données lorsque nous augmentons le nombre d'échantillons sélectionnés pour un nombre donné de paramètres pour déterminer si le nombre d'échantillons joue un rôle dans le calcul de l'indice.

Graphique 13 Comportement de l'indice en fonction du nombre d'échantillons pour l'ensemble de données de Terre-Neuve-et-Labrador. Une nouvelle fenêtre s'ouvrira.

Graphique 13
Comportement de l'indice en fonction du nombre d'échantillons pour l'ensemble de données de Terre-Neuve-et-Labrador

Observations : En général, ce graphique permet de constater que plus le nombre d'échantillons sélectionnés augmente pour un nombre donné de paramètres, plus le pourcentage des catégories « bonne » et « excellente » diminue au profit des catégories « mauvaise » et « médiocre ». Regardons maintenant le cas de quatre paramètres : Le pourcentage cumulé des catégories « bonne » et « excellente » baisse de 26,2 % à 18 % lorsque nous prenons dix échantillons au lieu de quatre dans le calcul de l'indice comparativement aux catégories « mauvaise » et « médiocre » dont le pourcentage cumulé augmente de 51,7 % à 60,1 %.

Graphique 14 Comportement de l'indice en fonction du nombre d'échantillons pour l'ensemble de données de l'Ontario. Une nouvelle fenêtre s'ouvrira.

Graphique 14
Comportement de l'indice en fonction du nombre d'échantillons pour l'ensemble de données de l'Ontario

Observations : Nous obtenons les mêmes conclusions que pour l'ensemble de données de Terre-Neuve-et-Labrador, plus le nombre d'échantillons sélectionnés augmente pour un nombre donné de paramètres, plus les catégories « bonne » et « excellente » perdent leur intensité au profit des catégories « mauvaise » et « médiocre ». Regardons le cas de dix paramètres : Le pourcentage cumulé des catégories « bonne » et « excellente » descend de 31,6 % à 2,9 % lorsque nous prenons 15 échantillons au lieu de 4 dans le calcul de l'indice comparativement aux catégories « mauvaise » et « médiocre » dont le pourcentage cumulé grimpe de 25,6 % à 57,5 %.

Graphique 15 Comportement de l'indice en fonction du nombre d'échantillons pour l'ensemble de données de la Colombie-Britannique. Une nouvelle fenêtre s'ouvrira.

Graphique 15
Comportement de l'indice en fonction du nombre d'échantillons pour l'ensemble de données de la Colombie-Britannique

Observations : De façon générale, plus le nombre d'échantillons sélectionnés augmente pour un nombre donné de paramètres, plus le pourcentage des catégories « bonne » et « excellente » diminue au profit des catégories « mauvaise » et « médiocre ». De plus, à partir de huit paramètres, le pourcentage de la catégorie « excellente » est de 0 % et cela peu importe le nombre d'échantillons. Regardons le cas de sept paramètres : Le pourcentage cumulé des catégories « bonne » et « excellente » baisse de 38,5 % à 3,9 % lorsque nous prenons 15 échantillons au lieu de 4 dans le calcul de l'indice comparativement aux catégories « mauvaise » et « médiocre » dont le pourcentage cumulé augmente 16,4 % à 66,6 %.

Graphique 16 Comportement de l'indice en fonction du nombre d'échantillons pour l'ensemble de données du Québec. Une nouvelle fenêtre s'ouvrira.

Graphique 16
Comportement de l'indice en fonction du nombre d'échantillons pour l'ensemble de données du Québec

Observations : Nous remarquons que plus le nombre d'échantillons sélectionnés augmente pour un nombre donné de paramètres, plus les catégories « bonne » et « excellente » perdent leur intensité au profit des catégories « mauvaise » et « moyenne ». Regardons le cas de six paramètres : Le pourcentage cumulé des catégories « bonne » et « excellente » diminue de 45,8 % à 37,5 % lorsque nous prenons six échantillons au lieu de quatre dans le calcul de l'indice comparativement aux catégories « mauvaise » et « moyenne » dont le pourcentage cumulé augmente de 37,5 % à 50,1 %.

Discussion : Les quatre derniers graphiques montrent que l'indice est sensible au nombre d'échantillons entrant dans le calcul. En général, plus nous augmentons le nombre d'échantillons dans le calcul de l'indice, plus les catégories « bonne » et « excellente » perdent de leur intensité au profit des catégories « mauvaise » et « médiocre » et ce, peu importe leur point de départ. Ceci s'explique par le fait qu'en augmentant le nombre d'échantillons, nous augmentons le nombre de résultats analytiques à analyser et la probabilité d'avoir un résultat non-conforme qui par conséquent aura des répercussions sur le calcul des trois termes de l'indice.

Analyse de la contribution des termes de l'indice

Dans cette section, nous analyserons pour chacun des ensembles de données la contribution des trois termes de l'indice lorsque nous augmentons le nombre de paramètres et d'échantillons dans le but de déterminer si la contribution de chacun des termes de l'indice est similaire. À noter que nous ne pouvons pas calculer la contribution des termes en fonction de l'indice directement en raison de la racine carrée qui englobe la somme des trois termes au carré. Cependant, nous pouvons exprimer l'équation de l'indice de la façon suivante afin d'évaluer la contribution de chacun des termes au carré.

Formule 10

Graphique 17 Pourcentage de contribution des termes de l'indice pour l'ensemble de données de Terre-Neuve-et-Labrador. Une nouvelle fenêtre s'ouvrira.

Graphique 17
Pourcentage de contribution des termes de l'indice pour l'ensemble de données de Terre-Neuve-et-Labrador

Observations : La contribution du premier terme représente entre 50 et 60 % de la contribution totale de l'indice tandis que celle du troisième terme varie entre 20 et 30 %. De plus, nous remarquons que la contribution du premier terme diminue lorsque nous augmentons le nombre de paramètres pour un nombre donné d'échantillons contrairement au troisième terme dont la contribution semble augmenter. Par ailleurs, la contribution du premier terme s'accroît lorsque nous augmentons le nombre d'échantillons pour un nombre donné de paramètres tandis qu'elle diminue pour les deux autres termes.

Graphique 18 Pourcentage de contribution des termes de l'indice pour l'ensemble de données de l'Ontario. Une nouvelle fenêtre s'ouvrira.

Graphique 18
Pourcentage de contribution des termes de l'indice pour l'ensemble de données de l'Ontario

Observations : La contribution du premier terme est encore plus marquante pour l'ensemble des données de l'Ontario avec une contribution variant entre 60 et 75 % de la contribution totale de l'indice. Aussi, nous remarquons que la contribution du premier terme baisse lorsque nous augmentons le nombre de paramètres pour un nombre donné d'échantillons tandis qu'elle augmente pour le troisième terme. De plus, la contribution du premier terme augmente lorsque nous augmentons le nombre d'échantillons de quatre à dix pour un nombre donné de paramètres tandis qu'elle diminue pour les deux autres termes.

Graphique 19 Pourcentage de contribution des termes de l'indice pour l'ensemble de données de la Colombie-Britannique. Une nouvelle fenêtre s'ouvrira.

Graphique 19
Pourcentage de contribution des termes de l'indice pour l'ensemble de données de la Colombie-Britannique

Observations : La contribution du premier terme représente entre 45 et 74 % de la contribution totale de l'indice. Nous remarquons aussi que la contribution du premier terme diminue lorsque nous augmentons le nombre de paramètres pour un nombre donné d'échantillons (à l'exception de 15 échantillons) tandis qu'elle semble augmenter pour le troisième terme. Par ailleurs, la contribution du premier terme s'accroît lorsque nous augmentons le nombre d'échantillons pour un nombre donné de paramètres tandis qu'elle diminue pour les deux autres termes.

Graphique 20 Pourcentage de contribution des termes de l'indice pour l'ensemble de données du Québec. Une nouvelle fenêtre s'ouvrira.

Graphique 20
Pourcentage de contribution des termes de l'indice pour l'ensemble de données du Québec

Observations : La contribution du premier terme se situe aux alentours de 80 % de la contribution totale de l'indice tandis que la contribution de chacun des deux autres termes tombe à près de 10 %. Pour l'ensemble de données du Québec, la contribution de chacun des termes reste stable peu importe si nous varions légèrement le nombre de paramètres ou d'échantillons.

Discussion : Ces quatre graphiques nous indiquent que la contribution du premier terme est de beaucoup supérieure (variant entre 45 et 80 %) à ceux des deux autres termes. Le fait d'augmenter le nombre de paramètres dans le calcul de l'indice entraîne pour le premier terme une forte augmentation de son dénominateur qui est contrebalancé par l'augmentation de la probabilité d'avoir un résultat non-conforme, résultant en une légère diminution de sa contribution. En augmentant le nombre d'échantillons, nous augmentons la probabilité d'avoir un paramètre non-conforme et par le fait même nous augmentons la contribution du premier terme.

Analyse de la corrélation entre les termes de l'indice

À l'intérieur de cette section, nous regarderons pour chacun des ensembles de données la corrélation entre les termes de l'indice pris deux par deux, tout en variant le nombre de paramètres et d'échantillons. Cette analyse permettra d'identifier s'il y a une forte relation entre deux termes de l'indice. Si tel est le cas, cela signifiera qu'un des deux termes est peut-être redondant dans le calcul de l'indice.

Tableau 30 Corrélation entre les termes de l'indice. Une nouvelle fenêtre s'ouvrira

Tableau 30
Corrélation entre les termes de l'indice

En regardant le tableau, nous constatons que la corrélation est généralement plus forte (sinon égale) entre le deuxième et le troisième terme de l'indice qu'entre les deux premiers termes. De plus, la corrélation entre le deuxième et le troisième terme est non négligeable dans la majorité des cas, variant entre 0,58 et 0,96. En règle générale, la corrélation entre les termes de l'indice pris deux par deux dépend du nombre de paramètres et d'échantillons entrant dans le calcul de l'indice. Plus nous augmentons le nombre d'échantillons pour un nombre donné de paramètres, plus la corrélation impliquant le premier terme diminue. Il est plus difficile de déterminer le sens de la relation lorsque nous augmentons le nombre de paramètres dans le calcul pour un nombre donné d'échantillons. Parfois, la corrélation augmente et parfois elle diminue.

Analyse de l'indice en utilisant trois échantillons au lieu de quatre

L'objectif de cette section est de regarder si l'utilisation de trois échantillons au lieu de quatre par année influence les résultats de l'indice. Même s'il est recommandé d'avoir au moins quatre échantillons par année pour le calcul de l'indice, quelques stations avec trois échantillons par année ont été considérées car elles étaient éloignées et plus difficiles d'accès, rendant le coût du prélèvement de l'eau plus élevé. Pour ce faire, nous débuterons en comparant les résultats de l'indice obtenus avec trois et quatre échantillons. Par la suite, nous regarderons le pourcentage de stations qui changent de catégorie lorsque nous utilisons trois échantillons au lieu de quatre dans le calcul de l'indice.

Résultats de l'indice en utilisant trois et quatre échantillons

Comme dans les sections précédentes, voici pour chacune des provinces un graphique montrant les résultats de l'indice avec trois et quatre échantillons tout en faisant varier le nombre de paramètres entrant dans le calcul.

Graphique 21 Résultats de l'indice en utilisant trois et quatre échantillons pour l'ensemble de données de Terre-Neuve-et-Labrador. Une nouvelle fenêtre s'ouvrira.

Graphique 21
Résultats de l'indice en utilisant trois et quatre échantillons pour l'ensemble de données de Terre-Neuve-et-Labrador

Observation : En observant ce graphique, nous constatons qu'il n'y a pas vraiment de différence si nous utilisons trois échantillons au lieu de quatre dans le calcul de l'indice et cela, peu importe le nombre de paramètres entrant dans le calcul.

Graphique 22 Résultat de l'indice en utilisant trois et quatre échantillons pour l'ensemble de données de l'Ontario. Une nouvelle fenêtre s'ouvrira.

Graphique 22
Résultat de l'indice en utilisant trois et quatre échantillons pour l'ensemble de données de l'Ontario

Observations : Ce graphique semble montrer une légère différence en utilisant trois échantillons au lieu de quatre dans le calcul de l'indice. La majorité des différences sont inférieures à 3 % avec un maximum avoisinant les 7 % pour la catégorie « bonne » avec 14 paramètres.

Graphique 23 Résultat de l'indice en utilisant trois et quatre échantillons pour l'ensemble de données de la Colombie-Britannique. Une nouvelle fenêtre s'ouvrira.

Graphique 23
Résultat de l'indice en utilisant trois et quatre échantillons pour l'ensemble de données de la Colombie-Britannique

Observations : Ici aussi, il semble exister une légère différence en utilisant trois échantillons au lieu de quatre dans le calcul de l'indice. La majorité des différences sont inférieures à 3 % avec un maximum avoisinant les 7,7 % pour la catégorie « bonne » avec 8 paramètres.

Graphique 24 Résultat de l'indice en utilisant trois et quatre échantillons pour l'ensemble de données du Québec. Une nouvelle fenêtre s'ouvrira.

Graphique 24
Résultat de l'indice en utilisant trois et quatre échantillons pour l'ensemble de données du Québec

Observation : En observant ce graphique, il ne semble pas vraiment y avoir de différence en utilisant trois échantillons au lieu de quatre dans le calcul de l'indice.

Discussion : Ces quatre derniers graphiques nous indiquent qu'il semble parfois exister une légère différence pour certaines provinces lorsque nous utilisons trois échantillons au lieu de quatre dans le calcul de l'indice. Cependant, la bonne représentativité de la qualité de l'eau doit être considérée lorsque nous utilisons seulement trois ou quatre échantillons par année dans le calcul de l'indice.

Pourcentage des stations qui change de catégorie en utilisant trois échantillons au lieu de quatre

Pour la réalisation de cette analyse, voici la procédure que nous utiliserons pour chaque ensemble de données :

  1. Nous attribuons un nombre aléatoire à chaque échantillon en utilisant une loi uniforme,
  2. Nous ordonnons en ordre croissant les échantillons en fonction du nombre aléatoire par station et par année.
  3. Nous réalisons toutes les combinaisons possibles de x paramètres parmi le nombre total de paramètres. Pour chacune de ces combinaisons :
  1. Nous sélectionnons toutes les séquences consécutives de quatre échantillons sans répétition des échantillons à l'intérieur d'une station et d'une année.
  2. Nous regroupons les quatre échantillons de trois années consécutives.
  3. Nous calculons l'indice sur les 12 échantillons.
  4. Nous choisissons au hasard trois échantillons parmi les quatre sélectionnés à l'étape i.
  5. Nous regroupons les trois échantillons des trois années consécutives.
  6. Nous calculons l'indice sur les 9 échantillons.
  7. Nous comparons les résultats obtenus avec 9 et 12 échantillons pour chacune des stations.
  • Nous présentons les résultats.
  • Tableau 31 Pourcentage des stations qui changent de catégorie en utilisant trois échantillons au lieu de quatre. Une nouvelle fenêtre s'ouvrira

    Tableau 31
    Pourcentage des stations qui changent de catégorie en utilisant trois échantillons au lieu de quatre

    Observations : En regardant ce tableau, la qualité de l'eau ne change pas en terme de catégorie pour plus de 86 % des stations lorsque nous utilisons trois échantillons au lieu de quatre dans le calcul de l'indice avec une différence moyenne des IQE inférieure à 0,8. Pour les stations dont la qualité de l'eau s'améliore (pourcentage inférieur à 13 %), la différence moyenne des IQE varie de 5,44 à 16,10. Le pourcentage des stations qui change de catégorie ne semble pas avoir de relation avec le nombre de paramètres entrant dans le calcul de l'indice.

    Discussion : Cette section permet de constater que l'utilisation de trois échantillons au lieu de quatre par année a peu d'influence dans le calcul de l'indice pour ces quatre ensembles de données. En fait, l'impact de trois ou quatre échantillons dans le calcul de l'IQE dépend de l'homogénéité de la qualité des eaux et des changements dans le temps. Mais encore une fois, est-ce que ce nombre d'échantillons (trois ou quatre) est assez grand pour bien représenter la qualité de l'eau?

    Analyse de la variabilité de l'indice à l'intérieur des stations

    Cette section permettra de regarder la variabilité potentielle de l'indice à l'intérieur des stations. Nous tenterons d'évaluer la variabilité potentielle en sélectionnant de nombreux sous échantillons et en calculant la valeur de l'indice pour chacun.

    Pour la réalisation de cette analyse, nous utiliserons tous les paramètres qui sont disponibles à l'intérieur des stations et nous garderons seulement les trois dernières années de chaque ensemble de données. Voici maintenant la procédure que nous utiliserons :

    1. Nous gardons tous les échantillons qui ont une valeur pour chacun des paramètres.
    2. Nous sélectionnons 1 000 répliques de x échantillons par année pour chaque station à l'aide d'un plan aléatoire simple sans remise.
    3. Nous gardons seulement les répliques dont la combinaison des x échantillons est différente des autres. Ici, nous ne voulons pas avoir deux fois la même combinaison de x échantillons dans les analyses.
    4. Nous calculons l'indice pour chacune des 1 000 répliques de chaque station.
    5. Nous calculons la moyenne, l'écart type et l'intervalle de confiance à 95 % de la valeur de l'indice obtenu par les 1 000 répliques pour chacune des stations lorsque le nombre d'échantillons dans la station pour les trois années le permet.
    6. Nous présentons les résultats.

    Le tableau 32 indique le nombre de paramètres ainsi que les années que nous utiliserons pour chacun des ensembles de données.

    Tableau 32 Paramètres et années utilisés selon les ensembles de données. Une nouvelle fenêtre s'ouvrira

    Tableau 32
    Paramètres et années utilisés selon les ensembles de données

    Ensemble de données de Terre-Neuve-et-Labrador

    Graphique 25 Intervalle de confiance à 95 % de la valeur de l'indice à l'intérieur des stations en sélectionnant quatre échantillons par année pour l'ensemble de données de Terre-Neuve-et-Labrador. Une nouvelle fenêtre s'ouvrira.

    Graphique 25
    Intervalle de confiance à 95 % de la valeur de l'indice à l'intérieur des stations en sélectionnant quatre échantillons par année pour l'ensemble de données de Terre-Neuve-et-Labrador

    Observations : Ce graphique permet de constater qu'il existe une assez bonne variabilité de l'indice à l'intérieur des stations. En calculant la différence entre la borne supérieure et la borne inférieure de l'intervalle de confiance, nous obtenons une différence moyenne de 14 points. Toujours selon l'intervalle de confiance à 95 %, la valeur de l'indice peut varier de 4 points jusqu'à 27 points selon la station. De plus, la catégorisation de l'indice est aussi affectée pour certaines stations car la catégorisation augmente ou diminue d'une et même de deux catégories.

    En augmentant le nombre d'échantillons par année1, la valeur moyenne de l'indice diminue à l'intérieur d'une station ainsi que sa variabilité en général ce qui a pour effet d'augmenter la stabilité de l'indice. La valeur moyenne de l'indice passe de 64,37 à 63,33 et à 62,41 tandis que l'écart type moyen passe de 3,54 à 3,08 et à 2,79 lorsque nous augmentons de quatre à six et à huit échantillons par année.

    Ensemble de données de l'Ontario

    Graphique 26 Intervalle de confiance à 95 % de la valeur de l'indice à l'intérieur des stations en sélectionnant quatre échantillons par année pour l'ensemble de données de l'Ontario. Une nouvelle fenêtre s'ouvrira.

    Graphique 26
    Intervalle de confiance à 95 % de la valeur de l'indice à l'intérieur des stations en sélectionnant quatre échantillons par année pour l'ensemble de données de l'Ontario

    Observations : Nous constatons qu'il existe ici aussi une assez bonne variabilité de l'indice à l'intérieur des stations. De plus, pour l'ensemble de données de l'Ontario, il semblerait que plus la valeur de l'indice diminue, plus la variabilité semble augmenter. Ici, la différence moyenne entre la valeur de la borne supérieure et la borne inférieure de l'intervalle de confiance à 95 % est de 13,57 points avec un minimum de 5,88 et un maximum de 35 points. La catégorisation de l'indice est aussi affectée car pour certaines stations, la catégorisation augmente ou diminue d'une ou même de deux catégories.

    En augmentant le nombre d'échantillons sélectionnés par année2, la valeur moyenne de l'indice ainsi que sa variabilité tend à diminuer à l'intérieur d'une station ce qui a pour effet d'augmenter la stabilité de l'indice. La valeur moyenne de l'indice passe de 73,57 à 70,86 tandis que l'écart type moyen passe de 3,46 à 2,45 lorsque nous augmentons de 4 à 6 échantillons par année.

    Ensemble de données de la Colombie-Britannique

    Graphique 27 Intervalle de confiance à 95 % de la valeur de l'indice à l'intérieur des stations en sélectionnant quatre échantillons par année pour l'ensemble de données de la Colombie-Britannique. Une nouvelle fenêtre s'ouvrira.

    Graphique 27
    Intervalle de confiance à 95 % de la valeur de l'indice à l'intérieur des stations en sélectionnant quatre échantillons par année pour l'ensemble de données de la Colombie-Britannique

    Observations : Ce graphique nous indique qu'une des quatre stations n'échoue jamais les recommandations pour les trois années à l'étude. De plus, nous observons qu'il existe une assez bonne variabilité de l'indice à l'intérieur des trois autres stations. La différence moyenne entre la valeur de la borne supérieure et la borne inférieure de l'intervalle de confiance à 95 % est 15,78 points avec un minimum de 0 et un maximum de 29,6 points. La catégorisation de l'indice est affectée pour les trois stations ayant de la variabilité.

    En augmentant le nombre d'échantillons de quatre à six et à huit par année6, la valeur moyenne de l'indice diminue tandis que sa variabilité reste assez stable à l'intérieur d'une station.

    Ensemble de données du Québec

    Graphique 28 Intervalle de confiance à 95 % de la valeur de l'indice à l'intérieur des stations en sélectionnant quatre échantillons par année pour l'ensemble de données du Québec. Une nouvelle fenêtre s'ouvrira.

    Graphique 28
    Intervalle de confiance à 95 % de la valeur de l'indice à l'intérieur des stations en sélectionnant quatre échantillons par année pour l'ensemble de données du Québec

    Observations : Encore une fois, nous observons qu'il existe une assez bonne variabilité de l'indice à l'intérieur de certaines stations. La différence moyenne entre la valeur de la borne supérieure et la borne inférieure de l'intervalle de confiance à 95 % est 13,15 points avec un minimum de 0 et un maximum de 38,7 points. Aussi, la catégorisation de l'indice est affectée, car pour certaines stations la catégorisation augmente ou diminue d'une et même de deux catégories.

    Malheureusement, pour l'ensemble de données du Québec nous ne pouvons pas augmenter le nombre d'échantillons sélectionnés par année en raison du petit nombre d'échantillons par station dans l'ensemble de données initial.

    Discussion : Cette analyse montre qu'il existe une bonne variabilité de la valeur de l'indice à l'intérieur de certaines stations et cela, peu importe le nombre d'échantillons que nous sélectionnons par année pour le calcul de l'indice. Nous avons aussi remarqué que plus nous augmentons le nombre d'échantillons sélectionnés par année, plus la valeur de l'indice diminue ce qui rejoint la conclusion de la section Analyse de l'indice en fonction du nombre d'échantillons. De plus, la variabilité de l'indice tend à diminuer pour une station donnée lorsque nous augmentons le nombre d'échantillons sélectionnés par année. Cette diminution de la variabilité peut s'expliquer par le fait que nous avons un ensemble plus représentatif et plus homogène avec un nombre d'échantillons plus grand. L'annexe contient les résultats par station lorsque nous augmentons le nombre d'échantillons sélectionnés par année pour chacun des ensembles de données.

    Analyse de l'indice en tenant compte de la saison

    Puisque la période (date) de prélèvement des échantillons n'est pas toujours la même, il est important de regarder si les saisons ont un impact dans le calcul de l'indice. Si tel est le cas, il serait préférable d'en tenir compte en déterminant les périodes pour faire les prélèvements.

    Nous débuterons cette section en analysant le respect des recommandations de chaque paramètre pour chacune des saisons. Ensuite, nous examinerons le comportement de l'indice lorsque nous tenons compte de la saison dans le calcul pour chacun des ensembles de données à l'exception de celui de Terre-Neuve-et-Labrador qui ne contient pas la date de prélèvement de l'échantillon. Définissons la variable « saison » comme suit :

    Hiver : 21 décembre au 20 mars.
    Printemps : 21 mars au 20 juin.
    Été : 21 juin au 20 septembre.
    Automne : 21 septembre au 20 décembre.

    Analyse sur le respect des recommandations par saison

    Nous présenterons pour chacun des ensembles de données  (à l'exception de Terre-Neuve-et-Labrador) le pourcentage de valeurs qui sont conformes aux recommandations pour chacune des saisons. Cette analyse permettra de regarder si le pourcentage de conformité est sensiblement le même d'une saison à l'autre pour chaque paramètre.

    Tableau 33 Pourcentage des échantillons respectant les recommandations par saison pour chaque paramètre pour l'ensemble de données de l'Ontario. Une nouvelle fenêtre s'ouvrira

    Tableau 33
    Pourcentage des échantillons respectant les recommandations par saison pour chaque paramètre pour l'ensemble de données de l'Ontario

    Observations : Ce tableau permet d'observer que le pourcentage des échantillons respectant les recommandations est sensiblement le même d'une saison à l'autre pour un grand nombre de paramètres. Cependant, il semble y avoir une légère différence entre les saisons pour les paramètres cadmium, chlorure, chrome, nitrate, sédiments en suspension (SS) ainsi que la température.  Le pourcentage de conformité des paramètres cadmium, chlorure, chrome et nitrate est un peu plus bas pour la saison de l'hiver comparativement aux autres saisons. Par ailleurs, le printemps semble la saison où le paramètre sédiments en suspensions (SS) échoue le plus souvent tandis que pour le paramètre température, la saison de l'été semble être plus difficile pour le respect des recommandations. 

    Tableau 34 Pourcentage des échantillons respectant les recommandations par saison pour chaque paramètre pour l'ensemble de données de la Colombie-Britannique. Une nouvelle fenêtre s'ouvrira

    Tableau 34
    Pourcentage des échantillons respectant les recommandations par saison pour chaque paramètre pour l'ensemble de données de la Colombie-Britannique

    Observations : Pour l'ensemble de données de la Colombie-Britannique, la saison dans laquelle les échantillons ont été prélevés n'a pas d'impact pour les paramètres chrome, pH et plomb. Cela diffère légèrement pour les autres paramètres. La saison de l'hiver semble la saison où il est plus difficile de respecter ces recommandations pour le paramètre cadmium. Les paramètres cuivre et zinc ont un peu plus de difficulté à respecter les recommandations durant la saison du printemps tandis que la saison de l'été montre un pourcentage d'échec plus élevé pour les paramètres phosphore et la température.

    Tableau 35 Pourcentage des échantillons respectant les recommandations par saison pour chaque paramètre pour l'ensemble de données du Québec. Une nouvelle fenêtre s'ouvrira

    Tableau 35
    Pourcentage des échantillons respectant les recommandations par saison pour chaque paramètre pour l'ensemble de données du Québec

    Observations : L'ensemble de données du Québec ne contient pas d'échantillon qui a été pris durant la période hivernale. En général, le pourcentage des échantillons respectant les recommandations est sensiblement le même d'une saison à l'autre, sauf pour les paramètres chlorophylle a et turbidité où nous notons un pourcentage de conformité plus faible en été.

    Discussion : De façon générale, nous pouvons dire que le pourcentage de conformité des paramètres est légèrement différent pour certains paramètres d'une saison à l'autre. Regardons maintenant ce qui se passe lorsque nous enlevons une saison dans le calcul de l'indice.

    Analyse de l'indice en enlevant une saison

    Dans cette sous-section, nous étudierons le comportement de l'indice lorsque nous excluons une saison dans le calcul de l'indice. Pour ce faire, nous utiliserons l'ensemble des paramètres et des échantillons mis à notre disposition par chacun des ensembles de données en gardant seulement les stations qui ont au moins quatre échantillons et quatre paramètres par année avec au minimum 12 échantillons pour trois années consécutives pour chacun des scénarios (global, sans hiver, sans printemps, sans été et sans automne).

    Graphique 29 Résultat de l'indice en enlevant une saison pour l'ensemble de données de l'Ontario. Une nouvelle fenêtre s'ouvrira.

    Graphique 29
    Résultat de l'indice en enlevant une saison pour l'ensemble de données de l'Ontario

    Observations : En observant ce graphique, il existe une petite différence lorsque nous enlevons une saison dans le calcul de l'indice. En comparant les résultats du scénario global avec chacun des autres scénarios, nous remarquons que le pourcentage de la catégorie « médiocre » diminue et celui de la catégorie « bonne » augmente lorsque les données de l'hiver ou celles du printemps sont exclues. De plus, il y a diminution du pourcentage de la catégorie « moyenne » et augmentation du pourcentage de la catégorie « bonne » lorsque nous excluons les données de l'été ou celles de l'automne.

    Graphique 30 Résultat de l'indice en enlevant une saison pour l'ensemble de données de la Colombie-Britannique. Une nouvelle fenêtre s'ouvrira.

    Graphique 30
    Résultat de l'indice en enlevant une saison pour l'ensemble de données de la Colombie-Britannique

    Observations : Ce graphique permet de constater qu'il existe une différence lorsqu'on enlève la saison de l'été ainsi que celle de l'automne dans le calcul de l'indice. En comparant les résultats du scénario global avec chacun des autres scénarios, nous remarquons que le pourcentage de la catégorie « moyenne » diminue tandis que celui de la catégorie « bonne » augmente lorsque la saison estivale ou automnale n'est pas considérée dans le calcul de l'indice.

    Graphique 31 Résultat de l'indice en enlevant une saison pour l'ensemble de données du Québec. Une nouvelle fenêtre s'ouvrira.

    Graphique 31
    Résultat de l'indice en enlevant une saison pour l'ensemble de données du Québec

    Observations : Pour le Québec, il existe des différences si nous enlevons une saison dans le calcul de l'indice. En comparant les résultats du scénario global avec chacun des autres scénarios, nous remarquons que le pourcentage des catégories « médiocre » et « bonne » diminue tandis que celui des catégories « moyenne » et « excellente » augmente lorsque nous excluons les données du printemps. De plus, il y a diminution du pourcentage de la catégorie « moyenne » et augmentation du pourcentage de la catégorie « bonne » lorsque les données de la saison automnale sont exclues dans le calcul de l'indice.

    Discussion : Il semble exister une différence dans la catégorisation de l'indice lorsque nous excluons les données d'une saison dans le calcul de l'indice. Le fait de ne pas inclure les données d'une saison peut entraîner un biais dans le calcul de l'indice et de son interprétation.


    Notes

    1. Les graphiques de six et de huit échantillons ne sont pas présentés dans le but d'alléger le document mais l'annexe contient les résultats pour chacune des stations.
    2. Les graphiques de six et de huit échantillons ne sont pas présentés dans le but d'alléger le document mais l'annexe contient les résultats pour chacune des stations.