Statistique Canada
Symbole du gouvernement du Canada

Liens de la barre de menu commune

Menu de navigation du site

Analyse descriptive

Avertissement Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Présentation des données brutes
Analyse du coefficient d'écart
Analyse du coefficient de corrélation
Analyse en composantes principales

Dans ce chapitre, nous débuterons par la présentation des données brutes de l'étude avec la définition des quatre ensembles de données, des statistiques descriptives, de l'analyse du respect des recommandations pour chacun des paramètres et de la représentation graphique. Par la suite, nous analyserons les coefficients d'écart pour chaque paramètre avec des statistiques descriptives et des graphiques. Viendra ensuite l'analyse du coefficient de corrélation entre les paramètres pris deux par deux sur les valeurs brutes et sur les coefficients d'écart afin de déterminer s'il y a une forte relation entre eux. En dernier lieu, une analyse en composantes principales sera effectuée sur les données brutes pour déterminer si chacun des paramètres a son importance dans le calcul de l'indice.

Présentation des données brutes

Nous débuterons avec la définition des ensembles de données que nous disposons pour la réalisation de cette étude. Ensuite, l'analyse descriptive, l'analyse sur le respect des recommandations ainsi que la représentation graphique de certains paramètres seront abordées.

Définition des ensembles de données

Voici les ensembles de données mis à notre disposition par certaines provinces. À noter qu'ils contiennent des paramètres différents ou supplémentaires que ceux utilisés pour le calcul de l'IQE dans Indicateurs canadiens de durabilité de l'environnement, 2005.

Tableau 1 Définition des ensembles de données. Une nouvelle fenêtre s'ouvrira

Tableau 1
Définition des ensembles de données

Statistiques descriptives

Présentation pour chacun des ensembles de données d'un tableau contenant les statistiques descriptives suivantes sur les données brutes pour chacun des paramètres :

  • Les indices de positions : moyenne et médiane.
  • Un indice de dispersion : l'écart type.
  • Ainsi que l'effectif représentant le nombre d'échantillons.
Tableau 2 Statistiques descriptives des paramètres pour l'ensemble de données de Terre-Neuve-et-Labrador . Une nouvelle fenêtre s'ouvrira

Tableau 2
Statistiques descriptives des paramètres pour l'ensemble de données de Terre-Neuve-et-Labrador

Statistiques descriptives des paramètres pour l'ensemble de données de l'Ontario. Une nouvelle fenêtre s'ouvrira

Tableau 3
Statistiques descriptives des paramètres pour l'ensemble de données de l'Ontario

Tableau 4 Statistiques descriptives des paramètres pour l'ensemble de données de la Colombie-Britannique. Une nouvelle fenêtre s'ouvrira

Tableau 4
Statistiques descriptives des paramètres pour l'ensemble de données de la Colombie-Britannique

Tableau 5 Statistiques descriptives des paramètres pour l'ensemble de données du Québec. Une nouvelle fenêtre s'ouvrira

Tableau 5
Statistiques descriptives des paramètres pour l'ensemble de données du Québec

Discussion : En regardant ces tableaux de plus près, nous remarquons que la moyenne est supérieure à la médiane pour de nombreux paramètres. En effet, une majeure partie des paramètres suit une loi log-normale1, et ainsi la moyenne est « attirée » vers le haut avec les valeurs extrêmes. La médiane est donc un meilleur indicateur de tendance centrale. De plus, certains paramètres ont une très grande variabilité qui peut s'expliquer par des valeurs relativement élevées qui devraient augmenter la valeur du troisième terme de l'indice.

Analyse sur le respect des recommandations

Cette sous-section présentera pour chacun des ensembles de données le pourcentage de valeurs qui sont conformes aux recommandations. Cette analyse cherche à déterminer les paramètres dont les recommandations sont difficiles à atteindre. À l'annexe, se trouvent les recommandations pour la protection de la vie aquatique utilisées par chacun des ensembles de données pour évaluer la qualité de l'eau.

Tableau 6 Pourcentage des échantillons respectant les recommandations pour l'ensemble de données de Terre-Neuve-et-Labrador. Une nouvelle fenêtre s'ouvrira

Tableau 6
Pourcentage des échantillons respectant les recommandations pour l'ensemble de données de Terre-Neuve-et-Labrador

Observations : 73,6 % des échantillons respectent les recommandations pour l'ensemble de données de Terre-Neuve-et-Labrador. Nous observons que les paramètres aluminium (10,7 %) et plomb (27,5 %) atteignent difficilement leurs recommandations tandis que le paramètre nickel n'échoue jamais.

Tableau 7 Pourcentage des échantillons respectant les recommandations pour l'ensemble de données de l'Ontario. Une nouvelle fenêtre s'ouvrira

Tableau 7
Pourcentage des échantillons respectant les recommandations pour l'ensemble de données de l'Ontario

Observations : 86,7 % des échantillons respectent les recommandations pour l'ensemble de données de l'Ontario. Les paramètres phosphore (49,6 %) et cadmium (50,8 %) atteignent difficilement leurs recommandations tandis que les paramètres nickel (99,9 %) et pH (99,9 %) n'échouent presque jamais.

Tableau 8 Pourcentage des échantillons respectant les recommandations pour l'ensemble de données de la Colombie-Britannique. Une nouvelle fenêtre s'ouvrira

Tableau 8
Pourcentage des échantillons respectant les recommandations pour l'ensemble de données de la Colombie-Britannique

Observations : 87 % des échantillons respectent les recommandations pour l'ensemble de données de la Colombie-Britannique. Seul le paramètre cadmium (8 %) atteint très difficilement ses recommandations.

Tableau 9 Pourcentage des échantillons respectant les recommandations pour l'ensemble de données du Québec. Une nouvelle fenêtre s'ouvrira

Tableau 9
Pourcentage des échantillons respectant les recommandations pour l'ensemble de données du Québec

Observations : 87,1 % des échantillons respectent les recommandations pour l'ensemble de données du Québec. Nous remarquons que le paramètre phosphore (60,4 %) échoue plus fréquemment ces recommandations que les autres paramètres.

Discussion : Il est intéressant de constater que le pourcentage de conformité varie d'un paramètre à l'autre à l'intérieur du même ensemble de données ainsi qu'entre les ensembles de données. Aussi, certains paramètres ont plus de difficulté que d'autres à respecter les recommandations utilisées par les experts de la qualité de l'eau soit en raison de valeurs très élevées enregistrées lors du prélèvement ou en raison d'une recommandation difficile à respecter. Ainsi, plus le pourcentage de conformité des paramètres est faible, plus la valeur de l'indice sera faible.

Représentation graphique

La représentation graphique en statistique est très importante car elle nous permet de visualiser directement la distribution d'une variable. Pour notre étude, nous allons présenter pour chacun des ensembles de données, seulement les paramètres ayant un faible pourcentage de conformité.

Chaque graphique dispose de sa propre échelle. Celle-ci s'étend de la valeur minimale à la valeur maximale.

Graphique 1 Paramètres aluminium, plomb et pH de l'ensemble de données de Terre-Neuve-et-Labrador. Une nouvelle fenêtre s'ouvrira.

Graphique 1
Paramètres aluminium, plomb et pH de l'ensemble de données de Terre-Neuve-et-Labrador

Graphique 2 Paramètres phosphore et cadmium de l'ensemble de données de l'Ontario. Une nouvelle fenêtre s'ouvrira.

Graphique 2
Paramètres phosphore et cadmium de l'ensemble de données de l'Ontario

Paramètre cadmium de l'ensemble de données de la Colombie-Britannique. Une nouvelle fenêtre s'ouvrira.

Graphique 3
Paramètre cadmium de l'ensemble de données de la Colombie-Britannique

Graphique 4 Paramètre phosphore de l'ensemble de données du Québec. Une nouvelle fenêtre s'ouvrira.

Graphique 4
Paramètre phosphore de l'ensemble de données du Québec

Analyse du coefficient d'écart

Cette section s'intéressera aux coefficients d'écart. Ces coefficients nous permettent de mesurer l'importance des écarts de nos observations par rapport à leurs recommandations. En étudiant ces coefficients, nous pouvons déterminer les paramètres qui dépassent fortement les recommandations. À noter qu'une valeur nulle au coefficient d'écart indique que le résultat est conforme aux recommandations.

Dans un premier temps, nous présenterons les statistiques descriptives des coefficients d'écart pour chacun des paramètres et nous terminerons avec la présentation de certains graphiques montrant la distribution des coefficients d'écart pour les paramètres ayant un faible pourcentage de conformité.

Statistiques descriptives du coefficient d'écart
Tableau 10 Statistiques descriptives du coefficient d'écart pour l'ensemble de données de Terre-Neuve-et-Labrador. Une nouvelle fenêtre s'ouvrira

Tableau 10
Statistiques descriptives du coefficient d'écart pour l'ensemble de données de Terre-Neuve-et-Labrador

Tableau 11 Statistiques descriptives du coefficient d'écart pour l'ensemble de données de l'Ontario. Une nouvelle fenêtre s'ouvrira

Tableau 11
Statistiques descriptives du coefficient d'écart pour l'ensemble de données de l'Ontario

Tableau 12 Statistiques descriptives du coefficient d'écart pour l'ensemble de données de la Colombie-Britannique. Une nouvelle fenêtre s'ouvrira

Tableau 12
Statistiques descriptives du coefficient d'écart pour l'ensemble de données de la Colombie-Britannique

Tableau 13 Statistiques descriptives du coefficient d'écart pour l'ensemble de données du Québec. Une nouvelle fenêtre s'ouvrira

Tableau 13
Statistiques descriptives du coefficient d'écart pour l'ensemble de données du Québec

Représentation graphique du coefficient d'écart
Graphique 5 Coefficient d'écart des paramètres aluminium, plomb et pH pour l'ensemble de données de Terre-Neuve-et-Labrador. Une nouvelle fenêtre s'ouvrira.

Graphique 5
Coefficient d'écart des paramètres aluminium, plomb et pH pour l'ensemble de données de Terre-Neuve-et-Labrador

Graphique 6 Coefficient d'écart des paramètres phosphore et cadmium pour l'ensemble de données de l'Ontario. Une nouvelle fenêtre s'ouvrira.

Graphique 6
Coefficient d'écart des paramètres phosphore et cadmium pour l'ensemble de données de l'Ontario

Graphique 7 Coefficient d'écart du paramètre cadmium pour l'ensemble de données de la Colombie-Britannique. Une nouvelle fenêtre s'ouvrira.

Graphique 7
Coefficient d'écart du paramètre cadmium pour l'ensemble de données de la Colombie-Britannique

Graphique 8 Coefficient d'écart du paramètre phosphore pour l'ensemble de données du Québec. Une nouvelle fenêtre s'ouvrira.

Graphique 8
Coefficient d'écart du paramètre phosphore pour l'ensemble de données du Québec

Discussion : En observant ces tableaux et ces graphiques, nous remarquons que certains paramètres ont une variabilité élevée provenant d'une grande fluctuation entre les coefficients d'écart observés. Cette variabilité élevée peut être la conséquence de deux facteurs : une valeur très élevée enregistrée lors du prélèvement de l'eau ou au contraire une recommandation très stricte, difficile à atteindre. Aussi, les graphiques indiquent que nous avons plus souvent de petits dépassements que de grands dépassements ce qui signifie que la valeur du troisième terme de l'indice ne sera pas seulement affecté par de grands coefficients d'écart.

Analyse du coefficient de corrélation

Cette section a pour objectif de chercher l'existence d'une forte relation entre deux paramètres, car il pourrait être judicieux d'en garder seulement un afin de diminuer la colinéarité entre les paramètres entrant dans le calcul de l'indice. Par exemple, supposons que les deux paramètres en question n'échouent jamais les recommandations, la valeur du premier terme de l'indice serait minimisée car son dénominateur serait plus grand ce qui entraînerait une valeur plus élevée de l'indice en raison d'une forte relation entre ces deux paramètres.

Nous présenterons deux types de coefficient de corrélation : le coefficient de Pearson et celui de Spearman. Le coefficient de Pearson est calculé à partir des données brutes tandis que le rang des observations est utilisé pour le calcul du coefficient de Spearman. Normalement, le coefficient de Pearson est utilisé lorsque nous avons la normalité des observations et celui de Spearman lorsque la normalité des paramètres n'est pas respectée. La valeur possible de ces deux coefficients est un nombre compris entre -1 et 1. Si deux paramètres augmentent en même temps, nous disons que la corrélation est positive tandis que si un paramètre décroît lorsque l'autre paramètre croît, nous sommes en présence d'une corrélation négative. Plus la valeur de la corrélation est proche de 1 ou de -1, plus forte est la relation entre les deux paramètres. Ces coefficients de corrélation seront analysés en utilisant les données brutes et les coefficients d'écart.

Coefficient de corrélation sur les données brutes

Tableau 14 Coefficient de corrélation des données brutes pour l'ensemble de données de Terre-Neuve-et-Labrador. Une nouvelle fenêtre s'ouvrira

Tableau 14
Coefficient de corrélation des données brutes pour l'ensemble de données de Terre-Neuve-et-Labrador

Observations : Les corrélations entre les paramètres ne sont pas très élevées. Seulement cinq corrélations (deux Pearson et trois Spearman) ont une valeur supérieure à 0,50. Une seule corrélation revient dans les deux méthodes, celle entre les paramètres aluminium et fer (0,66 et 0,64), il semble donc exister une relation entre ces paramètres. De plus, il semble exister une relation relativement forte entre le chlorure et le zinc (0,76).

Tableau 15 Coefficient de corrélation des données brutes pour l'ensemble de données de l'Ontario. Une nouvelle fenêtre s'ouvrira

Tableau 15
Coefficient de corrélation des données brutes pour l'ensemble de données de l'Ontario

Observations : Il y a 10 corrélations obtenues à l'aide de la méthode de Spearman qui sont supérieures à 0,50 comparativement à aucune lorsque nous utilisons la méthode de Pearson. Il semble exister une relation relativement forte entre le nitrite et le nitrate (0,78) ainsi qu'entre les sédiments en suspension (SS) et le phosphore (0,70). De plus, le cuivre semble être le paramètre qui est le plus corrélé avec quatre corrélations supérieures à 0,50.

Tableau 16 Coefficient de corrélation des données brutes pour l'ensemble de données de la Colombie-Britannique. Une nouvelle fenêtre s'ouvrira

Tableau 16
Coefficient de corrélation des données brutes pour l'ensemble de données de la Colombie-Britannique

Observations : Il y a au total 13 corrélations supérieures à 0,50 dans cet ensemble de données dont huit provenant de la méthode de Spearman. Les cinq corrélations de Pearson ayant une valeur supérieure à 0,50 sont aussi supérieures à 0,50 avec la méthode de Spearman. Il semble donc exister une relation entre ces paramètres : cadmium / plomb, cuivre / phosphore, phosphore / plomb, phosphore / zinc et plomb / zinc.

Tableau 17 Statistiques descriptives du coefficient d'écart pour l'ensemble de données du Québec. Une nouvelle fenêtre s'ouvrira

Tableau 17
Statistiques descriptives du coefficient d'écart pour l'ensemble de données du Québec

Observations : Il y a trois corrélations supérieures à 0,50 avec la méthode de Spearman contre aucune avec la méthode de Pearson. Il semble exister une relation relativement forte entre la turbidité et le phosphore (0,75).

Coefficient de corrélation sur les coefficients d'écart

Tableau 18 Coefficient de corrélation des coefficients d'écart pour l'ensemble de données de Terre-Neuve-et-Labrador. Une nouvelle fenêtre s'ouvrira

Tableau 18
Coefficient de corrélation des coefficients d'écart pour l'ensemble de données de Terre-Neuve-et-Labrador

Observations : Il y a cinq corrélations obtenues à l'aide de la méthode de Spearman qui sont supérieures à 0,50 comparativement à aucune avec la méthode de Pearson. Il semble exister une relation relativement forte entre le pH et l'aluminium (0,77).

Tableau 19 Coefficient de corrélation des coefficients d'écart pour l'ensemble de données de l'Ontario. Une nouvelle fenêtre s'ouvrira

Tableau 19
Coefficient de corrélation des coefficients d'écart pour l'ensemble de données de l'Ontario

Observation : Il y a seulement une corrélation entre les sédiments en suspension (SS) et le phosphore (0,53) qui est supérieure à 0,50.

Tableau 20 Coefficient de corrélation des coefficients d'écart pour l'ensemble de données de la Colombie-Britannique. Une nouvelle fenêtre s'ouvrira

Tableau 20
Coefficient de corrélation des coefficients d'écart pour l'ensemble de données de la Colombie-Britannique

Observation : Aucune corrélation supérieure à 0,50 dans cet ensemble de données.

Tableau 21 Coefficient de corrélation des coefficients d'écart pour l'ensemble de données du Québec. Une nouvelle fenêtre s'ouvrira

Tableau 21
Coefficient de corrélation des coefficients d'écart pour l'ensemble de données du Québec

Observation : Il y a seulement une corrélation entre la turbidité et le phosphore (0,57) qui est supérieure à 0,50.

Discussion : De façon générale, cette analyse nous indique qu'il semble exister une relation entre certains paramètres. Cependant, ces corrélations ne sont pas très fortes (aucune corrélation supérieure à 0,80). En effet, seulement 5 corrélations ont une valeur entre 0,70 et 0,78. Parmi ces cinq corrélations, deux proviennent de l'ensemble de données de l'Ontario (phosphore - SS et nitrate - nitrite). L'expert de la qualité de l'eau de cette province utilise sept paramètres (les paramètres nitrite et SS ne sont pas utilisés) pour le calcul de l'indice contrairement à la présente étude qui utilise le maximum de paramètres disponible pour regarder le comportement de l'indice. Ainsi, il est intéressant de constater que les experts de la qualité de l'eau sont conscients de ne pas inclure des paramètres qui ont une forte corrélation entre eux dans le calcul de l'indice, réduisant ainsi le potentiel de colinéarité.

Analyse en composantes principales

L'analyse en composantes principales (ACP) est une technique descriptive permettant d'étudier les relations qui existent entre les paramètres.  Elle cherche à réduire le nombre de paramètres de notre ensemble de données à quelques grandes dimensions (facteurs) en cherchant une solution à l'ensemble de la variance des paramètres mesurés. L'ACP nous permettra de déterminer si chacun des paramètres a son importance dans le calcul de l'indice en regardant si tous les paramètres sont représentés par au moins un facteur. Par le fait même, si chacun des facteurs est représenté par seulement un paramètre, cela voudra dire que ces paramètres peuvent représenter à eux seuls l'ensemble des données.

Avant de réaliser l'ACP, il faut s'assurer que les paramètres utilisés pour l'analyse suivent une distribution normale. Compte tenu du fait que les experts de la qualité de l'eau ont estimé que la grande majorité des variables suivaient une loi log-normale, nous utiliserons la transformation log_naturel (paramètre + 1) pour obtenir des paramètres suivant une loi normale. Le terme +1 est utilisé dans la transformation pour tenir compte du fait que le log_naturel de 0 est impossible.

Après la réalisation de l'ACP, nous devons regarder la mesure de Kaiser-Meyer-Olkin (KMO) qui est un indice d'adéquation de la solution factorielle qui indique jusqu'à quel point l'ensemble de paramètres retenus est un ensemble cohérent. Un KMO élevé indique qu'il existe une solution factorielle statistiquement acceptable qui représente les relations entre les paramètres. Une valeur de KMO de moins de 0,5 est jugée inacceptable tandis qu'une valeur de 0,7 est jugée moyennement acceptable. Le KMO reflète le rapport des corrélations entre les paramètres avec les corrélations partielles. Ces dernières reflètent l'unicité de l'apport de chaque paramètre.

Pour mener cette analyse, nous déterminerons le nombre de valeurs propres à retenir et étudierons le comportement de chacun de nos paramètres sur les différents axes factoriels. Nous garderons tous les facteurs dont la valeur propre est supérieure à 1. Pour la détermination des axes, nous allons utiliser une rotation orthogonale en supposant que les facteurs sont indépendants les uns des autres afin de nous permettre d'obtenir une meilleure représentation des résultats. De plus, pour associer un paramètre à un facteur, une saturation (corrélation entre le paramètre et le facteur auquel il est associé) d'au moins 0,40 est jugé nécessaire (Guadagnola et Velicer, 1988).

Ensemble de données de Terre-Neuve-et-Labrador

Tableau 22 Valeurs propres pour l'ensemble de données de Terre-Neuve-et-Labrador. Une nouvelle fenêtre s'ouvrira

Tableau 22
Valeurs propres pour l'ensemble de données de Terre-Neuve-et-Labrador

Pour l'ensemble de données de Terre-Neuve-et-Labrador, nous gardons les trois premiers facteurs qui ont une valeur propre supérieure à 1. Ces trois facteurs représentent 62,29 % de la variance expliquée des données avec un KMO de 0,68 ce qui signifie qu'il existe une solution factorielle moyennement acceptable.

Tableau 23 Représentation des paramètres sur les trois axes factoriels pour l'ensemble de données de Terre-Neuve-et-Labrador. Une nouvelle fenêtre s'ouvrira

Tableau 23
Représentation des paramètres sur les trois axes factoriels pour l'ensemble de données de Terre-Neuve-et-Labrador

Observations : Nous observons que chaque paramètre est représenté par un facteur (coefficient de saturation supérieure à 0,40) à l'exception du pH qui lui est représenté par deux facteurs. Ainsi, le premier facteur est représenté par les paramètres : chlorure, cuivre, plomb, phosphore et zinc tandis que les paramètres aluminium, fer, nickel et le pH représentent le deuxième facteur. Enfin, le troisième facteur quant à lui, est représenté par les paramètres oxygène dissous et le pH. Étant donné que chaque paramètre est représenté par au moins un facteur, nous pouvons affirmer que tous les paramètres ont une importance relativement forte dans le calcul de l'indice. Ce qui signifie qu'il n'y a pas un plus petit groupe de paramètres qui peuvent représenter à eux seuls l'ensemble des données.

Ensemble de données de l'Ontario

Pour l'ensemble de données de l'Ontario, nous réaliserons l'analyse en composantes principales pour l'ensemble des paramètres mis à notre disposition ainsi que pour ceux qui sont utilisés par l'expert de la qualité de l'eau de l'Ontario pour le calcul de l'IQE.

Tableau 24 Valeurs propres pour l'ensemble de données de l'Ontario. Une nouvelle fenêtre s'ouvrira

Tableau 24
Valeurs propres pour l'ensemble de données de l'Ontario

Pour l'ensemble de données complet, nous gardons les quatre premiers facteurs, qui représentent 56,9 % de la variance expliquée des données avec un KMO de 0,79 tandis que nous gardons les deux premiers facteurs pour l'ensemble de données partiel qui expliquent 53,78 % de la variance expliquée des données avec un KMO de 0,73.

Tableau 25 Représentation des paramètres sur les axes factoriels pour l'ensemble de données de l'Ontario. Une nouvelle fenêtre s'ouvrira

Tableau 25
Représentation des paramètres sur les axes factoriels pour l'ensemble de données de l'Ontario

Observations : Pour l'ensemble de données complet, il semblerait que l'importance du paramètre plomb serait relativement faible dans le calcul de l'indice car il n'est associé à aucun facteur tandis que les autres paramètres sont tous associés à un seul facteur. Pour l'ensemble de données partiel, chaque paramètre est représenté par un facteur à l'exception du phosphore qui lui, est représenté par deux facteurs. Dans les deux cas, puisque chaque paramètre est représenté par au moins un facteur à l'exception du paramètre plomb dans l'ensemble de données complet, nous pouvons affirmer que chacun des paramètres (à l'exception du paramètre plomb) a une importance relativement forte dans le calcul de l'indice.

Ensemble de données de la Colombie-Britannique

Tableau 26 Valeurs propres pour l'ensemble de données de la Colombie-Britannique. Une nouvelle fenêtre s'ouvrira

Tableau 26
Valeurs propres pour l'ensemble de données de la Colombie-Britannique

Pour l'ensemble de données de la Colombie-Britannique, les trois premiers facteurs représentent 62,76 % de la variance expliquée des données avec un KMO de 0,77.

Tableau 27 Représentation des paramètres sur les trois axes factoriels pour l'ensemble de données de la Colombie-Britannique. Une nouvelle fenêtre s'ouvrira

Tableau 27
Représentation des paramètres sur les trois axes factoriels pour l'ensemble de données de la Colombie-Britannique

Observation : Chaque paramètre est représenté par au moins par un facteur, ce qui signifie qu'ils ont tous une importance relativement forte dans le calcul de l'indice.

Ensemble de données du Québec

Tableau 28 Valeurs propres pour l'ensemble de données du Québec. Une nouvelle fenêtre s'ouvrira

Tableau 28
Valeurs propres pour l'ensemble de données du Québec

Pour l'ensemble des données du Québec, les deux premiers facteurs ont une valeur propre supérieure à l'unité, représentant 60,82 % de la variance expliquée des données avec un KMO de 0,74.

Tableau 29 Représentation des paramètres sur les deux axes factoriels pour l'ensemble de données du Québec. Une nouvelle fenêtre s'ouvrira

Tableau 29
Représentation des paramètres sur les deux axes factoriels pour l'ensemble de données du Québec

Observation : Puisque chaque paramètre est représenté par au moins un facteur, nous pouvons affirmer que chacun des paramètres a une importance relativement forte dans le calcul de l'indice.

Discussion : L'analyse en composantes principales nous a permis de constater que chacun des paramètres utilisés par les experts de la qualité de l'eau à l'exception du paramètre plomb de l'ensemble de données de l'Ontario, a son importance dans le calcul de l'indice comparativement à l'analyse de la corrélation qui nous permettait de déterminer s'il y avait de la redondance entre les paramètres.


Notes

  1. Les experts de la qualité de l'eau ont estimé que les variables suivaient une loi log-normale.