Statistique Canada
Symbole du gouvernement du Canada

Liens de la barre de menu commune

Fréquence cumulée

Contenu archivé

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

On utilise la fréquence cumulée pour déterminer le nombre d'observations qui se situent au-dessus (ou au-dessous) d'une valeur particulière dans un ensemble de données. On calcule la fréquence cumulée à l'aide d'un tableau de distribution de fréquences, qu'on peut construire à partir de diagrammes à tiges et à feuilles ou directement à partir des données.

On calcule la fréquence cumulée en ajoutant chaque fréquence tirée d'un tableau de distribution de fréquences à la somme de celles qui précèdent. La dernière valeur sera toujours égale au total des observations, puisque toutes les fréquences auront déjà été ajoutées au total précédent.

Variables discrètes ou continues

On peut caractériser des variables à l'intérieur d'un calcul à l'aide de la valeur qui leur est attribuée. Une variable discrète se compose de catégories séparées et indivisibles. Il ne peut exister de valeur entre une variable et sa voisine. Par exemple, si vous deviez observer les présences en classe enregistrées d'un jour à l'autre, vous pourriez découvrir que la classe compte 29 élèves une journée et 30 une autre journée. Il est cependant impossible que le nombre de présences en classe se situe entre 29 et 30. (Il n'y a simplement pas de place pour observer une valeur entre ces deux variables, étant donné qu'il est absolument impossible d'avoir une classe comptant 29 élèves et demi.)

On ne caractérise pas toutes les variables comme étant des variables discrètes. Certaines (comme le temps, la taille et le poids) ne se limitent pas à un ensemble fixe de catégories indivisibles. On appelle ces variables des variables continues; ces dernières sont divisibles en un nombre infini de valeurs possibles. Par exemple, on peut mesurer le temps en parties fractionnaires d'heures, de minutes, de secondes et de millisecondes. Alors, plutôt que d'achever une course en 11 ou 12 minutes, un jockey et son cheval peuvent franchir la ligne d'arrivée en 11 minutes et 43 secondes.

Il est essentiel de connaître la différence entre les deux types de variables pour calculer correctement leur fréquence cumulée.

Exemple 1 – Variables discrètes

On a compté et enregistré durant une période de 30 jours le nombre de gens qui faisaient de l'escalade autour du lac Louise, en Alberta. Voici les résultats du décompte :

31, 49, 19, 62, 24, 45, 23, 51, 55, 60, 40, 35 54, 26, 57, 37, 43, 65, 18, 41, 50, 56, 4, 54, 39, 52, 35, 51, 63, 42.

  1. Utilisez ces variables discrètes pour :
    • créer un diagramme à tiges et à feuilles et d'autres colonnes intitulées Fréquence, Valeur supérieure et Fréquence cumulée;
    • déterminer la fréquence des observations pour chaque tige;
    • trouver la valeur supérieure de chaque tige;
    • calculer la fréquence cumulée en additionnant les nombres dans la colonne Fréquence;
    • enregistrer tous les résultats du tracé.
  2. Tracez un diagramme à l'aide de l'axe des y (ou de la ligne verticale) pour la fréquence cumulée et de l'axe des x (ou de la ligne horizontale) pour le nombre de grimpeurs.

Réponses :

  1. Le nombre de grimpeurs varie de 4 à 65. Pour produire un diagramme à tiges et à feuilles, il vaut mieux grouper les données en intervalles de classe de 10.

    On peut situer chaque intervalle dans la colonne Tige. Les nombres dans cette colonne représentent le premier nombre de l'intervalle de classe. (La tige 0, par exemple, représente l'intervalle 0 à 9, la tige 1, l'intervalle de 10 à 19 et ainsi de suite.)

    La colonne Feuille sert à indiquer le nombre d'observations qui se situent à l'intérieur de chaque intervalle de classe. Dans la tige 2 (l'intervalle 20 à 29), par exemple, les trois observations, 23, 24 et 26, sont représentées sous la forme de 3, 4 et 6.

    La colonne Fréquence sert à indiquer le nombre d'observations qui se situent à l'intérieur d'un intervalle de classe. Dans la tige 5, par exemple, il y a 9 feuilles (ou observations), alors que dans la tige 1, il n'y en a que deux.

    Utilisez la colonne Fréquence pour le calcul de la fréquence cumulée.

    • Premièrement, ajoutez le nombre tiré de la colonne Fréquence au nombre précédent. Dans la tige 0, par exemple, nous n'avons qu'une seule observation et aucun nombre qui précède. La fréquence cumulée est donc un.

      1 + 0 = 1
    • Dans la tige 1, cependant, il y a deux observations. Ajoutez ces deux observations à la fréquence cumulée précédente (un) et vous obtiendrez trois.

      1 + 2 = 3
    • Dans la tige 2, il y a trois observations. Ajoutez ces trois observations à la fréquence cumulée précédente (trois) et vous obtiendrez comme fréquence cumulée pour la tige 2 le total (six).

      3 + 3 = 6
    • Continuez à effectuer ces calculs jusqu'à ce que vous ayez additionné tous les nombres dans la colonne Fréquence.
    • Enregistrez les résultats dans la colonne Fréquence cumulée.

    La colonne Valeur supérieure sert à indiquer l'observation (la variable) ayant la valeur la plus élevée dans chacun des intervalles de classe. Dans la tige 1, par exemple, les deux observations 8 et 9 représentent les variables 18 et 19. La valeur supérieure de ces deux variables est 19.

    Tableau 1. Nombre de grimpeurs par jour autour du lac Louise, en Alberta, pendant une période de 30 jours
    Tige Feuille Fréquence (f) Valeur supérieure Fréquence cumulée
    0 4 1 4 1
    1 8 9 2 19 1 + 2 = 3
    2 3 4 6 3 26 3 + 3 = 6
    3 1 5 5 7 9 5 39 6 + 5 = 11
    4 0 1 2 3 5 9 6 49 11 + 6 = 17
    5 0 1 1 2 4 4 5 6 7 9 57 17 + 9 = 26
    6 0 2 3 5 4 65 26 + 4 = 30
  2. Puisque ces variables sont des variables discrètes, utilisez les valeurs supérieures en traçant le diagramme. Tracez les points pour former une courbe continue appelée une ogive.

    Identifiez toujours le diagramme à l'aide de la fréquence cumulée, correspondant au nombre d'observations effectuées, sur l'axe vertical. Identifiez l'axe horizontal à l'aide de l'autre variable (le nombre de grimpeurs, dans ce cas) comme il est indiqué ci-dessous :

    Figure 1. Nombre de grimpeurs par jour autour du lac Louise, en Alberta, pendant une période de 30 jours.

Voici l'information qu'on peut obtenir à partir d'un diagramme ou d'un tableau :

  • durant 11 des 30 jours, 39 personnes ou moins ont grimpé aux rochers entourant le lac Louise;
  • durant 13 des 30 jours, 50 personnes ou plus ont grimpé aux rochers entourant le lac Louise.

Quand on utilise une variable continue, il faut adopter une méthode légèrement différente de celle utilisée pour une variable discrète afin de calculer la fréquence cumulée et de tracer le diagramme.

Exemple 2 – Variables continues

Voici l'épaisseur de la neige mesurée (arrondie au centimètre) et enregistrée pendant 25 jours à Whistler Mountain, en Colombie-Britannique :

242, 228, 217, 209, 253, 239, 266, 242, 251, 240, 223, 219, 246, 260, 258, 225, 234, 230, 249, 245, 254, 243, 235, 231, 257.

  1. Utilisez les variables continues qui figurent ci-dessus pour :
    • créer un tableau de distribution de fréquences;
    • trouver la fréquence de chaque intervalle de classe;
    • situer l'extrémité de chaque intervalle de classe;
    • calculer la fréquence cumulée en additionnant les nombres dans la colonne Fréquence;
    • enregistrer tous les résultats à l'intérieur du tableau.
  2. Utilisez l'information recueillie à partir du tableau de distribution de fréquences pour tracer un diagramme de fréquences cumulées.

Réponses :

  1. Les mesures de l'épaisseur de la neige varient de 209 cm à 266 cm. Pour produire le tableau de distribution de fréquences, il vaut mieux grouper les données en intervalles de classe de 10 cm chacun.

    Chaque intervalle de classe de 10 cm compris entre 200 cm et 270 cm est indiqué dans la colonne Épaisseur de la neige.

    La colonne Fréquence sert à enregistrer le nombre d'observations qui s'inscrivent à l'intérieur d'un intervalle particulier. Cette colonne représente les observations inscrites dans la colonne Comptage, mais sous forme numérique seulement.

    La colonne Extrémité est en bonne partie la même que la colonne Valeur supérieure figurant dans l'exercice 1, sauf que l'extrémité est le nombre le plus élevé inclus à l'intérieur de l'intervalle, indépendamment de la valeur réelle de chaque observation. Dans l'intervalle de classe de 210 à 220, par exemple, la valeur réelle des deux observations est 217 et 219 respectivement. Toutefois, plutôt que d'utiliser 219, on utilise l'extrémité 220.

    La colonne Fréquence cumulée sert à indiquer le total de l'ajout de chaque fréquence à celle qui précède.

    Tableau 2. Épaisseur de la neige mesurée à Whistler Mountain, en Colombie-Britannique, pendant une période de 25 jours
    Épaisseur de la neige(x) Comptage Fréquence (f) Extrémité Fréquence cumulée
          200 0
    200 à < 210 1 1 210 1
    210 à < 220 2 2 220 3
    220 à < 230 3 3 230 6
    230 à < 240 5 5 240 11
    240 à < 250 7 7 250 18
    250 à < 260 5 5 260 23
    260 à < 270 2 2 270 25
  2. Parce que la variable est continue, on utilise les extrémités de chaque intervalle de classe pour tracer le diagramme. On joint les points tracés pour former une ogive.

    Souvenez-vous que la fréquence cumulée (le nombre d'observations effectuées) est indiquée sur l'axe vertical y et que l'autre variable (l'épaisseur de la neige) est indiquée sur l'axe horizontal x, comme le montre la figure 2.

    Un diagramme montrant la hauteur de la neige mesurée à Whistler Mountain, en Colombie-Britannique, pendant une période de 25 jours

Voici l'information qu'on peut obtenir à partir du diagramme ou du tableau :

  • l'épaisseur de la neige n'a jamais été inférieure à 200 cm pendant une période de 25 jours;
  • l'épaisseur de la neige a été inférieure à 210 cm une journée sur 25;
  • l'épaisseur de la neige a été égale ou supérieure à 260 cm pendant deux des 25 jours.

Autres calculs de la fréquence cumulée

La distribution de fréquences relatives est un autre calcul qu'on peut effectuer à l'aide d'un tableau de distribution de fréquences. On définit cette méthode comme étant le pourcentage d'observations s'inscrivant à l'intérieur de chaque intervalle de classe. On peut trouver la fréquence relative cumulée en divisant la fréquence de chaque intervalle par le nombre total d'observations. (Pour plus de renseignements, voir Distribution de fréquences dans le chapitre intitulé Organisation des données.)

On peut aussi utiliser un tableau de distribution de fréquences pour calculer un pourcentage cumulé. Cette méthode de distribution de fréquences nous donne le pourcentage de la fréquence cumulée, au lieu de nous donner uniquement le pourcentage de la fréquence.