L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.
On utilise la fréquence cumulée pour déterminer le nombre d'observations qui se situent au-dessus (ou au-dessous) d'une valeur particulière dans un ensemble de données. On calcule la fréquence cumulée à l'aide d'un tableau de distribution de fréquences, qu'on peut construire à partir de diagrammes à tiges et à feuilles ou directement à partir des données.
On calcule la fréquence cumulée en ajoutant chaque fréquence tirée d'un tableau de distribution de fréquences à la somme de celles qui précèdent. La dernière valeur sera toujours égale au total des observations, puisque toutes les fréquences auront déjà été ajoutées au total précédent.
On peut caractériser des variables à l'intérieur d'un calcul à l'aide de la valeur qui leur est attribuée. Une variable discrète se compose de catégories séparées et indivisibles. Il ne peut exister de valeur entre une variable et sa voisine. Par exemple, si vous deviez observer les présences en classe enregistrées d'un jour à l'autre, vous pourriez découvrir que la classe compte 29 élèves une journée et 30 une autre journée. Il est cependant impossible que le nombre de présences en classe se situe entre 29 et 30. (Il n'y a simplement pas de place pour observer une valeur entre ces deux variables, étant donné qu'il est absolument impossible d'avoir une classe comptant 29 élèves et demi.)
On ne caractérise pas toutes les variables comme étant des variables discrètes. Certaines (comme le temps, la taille et le poids) ne se limitent pas à un ensemble fixe de catégories indivisibles. On appelle ces variables des variables continues; ces dernières sont divisibles en un nombre infini de valeurs possibles. Par exemple, on peut mesurer le temps en parties fractionnaires d'heures, de minutes, de secondes et de millisecondes. Alors, plutôt que d'achever une course en 11 ou 12 minutes, un jockey et son cheval peuvent franchir la ligne d'arrivée en 11 minutes et 43 secondes.
Il est essentiel de connaître la différence entre les deux types de variables pour calculer correctement leur fréquence cumulée.
On a compté et enregistré durant une période de 30 jours le nombre de gens qui faisaient de l'escalade autour du lac Louise, en Alberta. Voici les résultats du décompte :
31, 49, 19, 62, 24, 45, 23, 51, 55, 60, 40, 35 54, 26, 57, 37, 43, 65, 18, 41, 50, 56, 4, 54, 39, 52, 35, 51, 63, 42.
On peut situer chaque intervalle dans la colonne Tige. Les nombres dans cette colonne représentent le premier nombre de l'intervalle de classe. (La tige 0, par exemple, représente l'intervalle 0 à 9, la tige 1, l'intervalle de 10 à 19 et ainsi de suite.)
La colonne Feuille sert à indiquer le nombre d'observations qui se situent à l'intérieur de chaque intervalle de classe. Dans la tige 2 (l'intervalle 20 à 29), par exemple, les trois observations, 23, 24 et 26, sont représentées sous la forme de 3, 4 et 6.
La colonne Fréquence sert à indiquer le nombre d'observations qui se situent à l'intérieur d'un intervalle de classe. Dans la tige 5, par exemple, il y a 9 feuilles (ou observations), alors que dans la tige 1, il n'y en a que deux.
Utilisez la colonne Fréquence pour le calcul de la fréquence cumulée.
La colonne Valeur supérieure sert à indiquer l'observation (la variable) ayant la valeur la plus élevée dans chacun des intervalles de classe. Dans la tige 1, par exemple, les deux observations 8 et 9 représentent les variables 18 et 19. La valeur supérieure de ces deux variables est 19.
Tige | Feuille | Fréquence (f) | Valeur supérieure | Fréquence cumulée |
---|---|---|---|---|
0 | 4 | 1 | 4 | 1 |
1 | 8 9 | 2 | 19 | 1 + 2 = 3 |
2 | 3 4 6 | 3 | 26 | 3 + 3 = 6 |
3 | 1 5 5 7 9 | 5 | 39 | 6 + 5 = 11 |
4 | 0 1 2 3 5 9 | 6 | 49 | 11 + 6 = 17 |
5 | 0 1 1 2 4 4 5 6 7 | 9 | 57 | 17 + 9 = 26 |
6 | 0 2 3 5 | 4 | 65 | 26 + 4 = 30 |
Voici l'information qu'on peut obtenir à partir d'un diagramme ou d'un tableau :
Quand on utilise une variable continue, il faut adopter une méthode légèrement différente de celle utilisée pour une variable discrète afin de calculer la fréquence cumulée et de tracer le diagramme.
Voici l'épaisseur de la neige mesurée (arrondie au centimètre) et enregistrée pendant 25 jours à Whistler Mountain, en Colombie-Britannique :
242, 228, 217, 209, 253, 239, 266, 242, 251, 240, 223, 219, 246, 260, 258, 225, 234, 230, 249, 245, 254, 243, 235, 231, 257.
Épaisseur de la neige(x) | Comptage | Fréquence (f) | Extrémité | Fréquence cumulée |
---|---|---|---|---|
200 | 0 | |||
200 à < 210 | 1 | 210 | 1 | |
210 à < 220 | 2 | 220 | 3 | |
220 à < 230 | 3 | 230 | 6 | |
230 à < 240 | 5 | 240 | 11 | |
240 à < 250 | 7 | 250 | 18 | |
250 à < 260 | 5 | 260 | 23 | |
260 à < 270 | 2 | 270 | 25 |
Souvenez-vous que la fréquence cumulée (le nombre d'observations effectuées) est indiquée sur l'axe vertical y et que l'autre variable (l'épaisseur de la neige) est indiquée sur l'axe horizontal x, comme le montre la figure 2.
Voici l'information qu'on peut obtenir à partir du diagramme ou du tableau :
La distribution de fréquences relatives est un autre calcul qu'on peut effectuer à l'aide d'un tableau de distribution de fréquences. On définit cette méthode comme étant le pourcentage d'observations s'inscrivant à l'intérieur de chaque intervalle de classe. On peut trouver la fréquence relative cumulée en divisant la fréquence de chaque intervalle par le nombre total d'observations. (Pour plus de renseignements, voir Distribution de fréquences dans le chapitre intitulé Organisation des données.)
On peut aussi utiliser un tableau de distribution de fréquences pour calculer un pourcentage cumulé. Cette méthode de distribution de fréquences nous donne le pourcentage de la fréquence cumulée, au lieu de nous donner uniquement le pourcentage de la fréquence.