Statistique Canada
Symbole du gouvernement du Canada

Liens de la barre de menu commune

Étendue et quartiles

Contenu archivé

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

Étendue

L'étendue est très facile à calculer, parce qu'il s'agit simplement de la différence entre les valeurs observées les plus élevées et les plus faibles dans un ensemble de données. L'étendue, valeurs aberrantes comprises, est donc la dispersion réelle des données.

Étendue = différence entre les valeurs observées les plus élevées et les plus faibles

On ne tient pas compte de beaucoup de renseignements lorsqu'on calcule l'étendue, puisqu'on n'examine que les valeurs les plus élevées et les plus faibles.

La valeur de l'étendue d'un ensemble de données est grandement influencée par la présence d'une seule valeur inhabituellement élevée ou faible à l'intérieur de l'échantillon (une valeur aberrante).

On peut exprimer l'étendue sous la forme d'un intervalle comme 4 à 10, dans lequel 4 est la valeur la plus faible et 10, la valeur la plus élevée. On l'exprime souvent sous la forme de la longueur d'un intervalle. L'étendue de 4 à 10, par exemple, est de 6 chiffres. Nous utiliserons la dernière convention dans la présente section.

L'inconvénient d'utiliser l'étendue, c'est qu'elle ne mesure pas la dispersion de la majorité des valeurs d'un ensemble de données; elle ne mesure que la dispersion entre la valeur la plus élevée et la valeur la plus faible. Il faut donc d'autres mesures pour avoir une meilleure idée de la dispersion des données. L'étendue est un outil instructif qui sert de supplément à d'autres mesures comme l'écart-type ou l'écart semi-interquartile, mais on devrait rarement l'utiliser comme seule mesure de dispersion.

Quartiles

La médiane divise les données en deux ensembles égaux. (Pour plus de renseignements sur la médiane, consultez le chapitre sur les Mesures de tendance centrale) :

  • Le quartile inférieur est la valeur du milieu du premier ensemble, dans lequel 25 % des valeurs sont inférieures à Q1 et 75 % lui sont supérieures. Le premier quartile prend la notation Q1.
  • Le quartile supérieur est la valeur du milieu du deuxième ensemble, dans lequel 75 % des valeurs sont inférieures à Q3 et 25 % lui sont supérieures. Le troisième quartile prend donc la notation Q3.

Il convient de noter que la médiane prend la notation Q2, c'est-à-dire le deuxième quartile.

Exemple 1 – Quartiles supérieur et inférieur

  • Données : 6, 47, 49, 15, 43, 41, 7, 39, 43, 41, 36
  • Données ordonnées : 6, 7, 15, 36, 39, 41, 41, 43, 43, 47, 49
  • Médiane : 41
  • Quartile supérieur : 43
  • Quartile inférieur : 15

 

Écart interquartile

L'écart interquartile est une autre étendue utilisée comme mesure de la dispersion. La différence entre les quartiles supérieur et inférieur (Q3 - Q1), qu'on appelle l'écart interquartile, indique aussi la dispersion d'un ensemble de données. L'écart interquartile couvre 50 % d'un ensemble de données et élimine l'influence des valeurs aberrantes, parce qu'on soustrait, en effet, le quartile le plus élevé et le quartile le plus faible.

Écart interquartile = différence entre le quartile supérieur (Q3) et le quartile inférieur (Q1)

Exemple 2 – Étendue et quartiles

Gabrielle a commencé à travailler dans une boutique d'informatique il y a un an. Son superviseur lui a demandé de tenir un dossier du nombre d'ordinateur(s) qu'elle a vendu(s) chaque mois.

L'ensemble de données qui suit indique le nombre d'ordinateur(s) qu'elle a vendu(s) mensuellement au cours des 12 derniers mois :

34, 47, 1, 15, 57, 24, 20, 11, 19, 50, 28, 37.

Utilisez les dossiers des ordinateurs vendus par Gabrielle pour trouver :

  1. la médiane
  2. l'étendue
  3. les quartiles supérieur et inférieur
  4. l'écart interquartile

Réponses

  1. Les valeurs dans l'ordre ascendant sont :
    1, 11, 15, 19, 20, 24, 28, 34, 37, 47, 50, 57.

    Quelle valeur prendre pour la médiane = (12e + 1er) ÷ 2
    = 6,5e valeur
    = (6e + 7e observations) ÷ 2
    = (24 + 28) ÷ 2
    = 26
  2. Étendue = différence entre la valeur la plus élevée et la valeur la plus faible.
    = 57 – 1
    = 56
  3. Quartile inférieur = valeur du milieu de la première moitié des données Q1
    = la médiane de 1, 11, 15, 19, 20, 24
    = (3e + 4e observations) ÷ 2
    = (15 + 19) ÷ 2
    = 17
  4. Quartile supérieur = valeur du milieu de la seconde moitié des données Q3
    = la médiane de 28, 34, 37, 47, 50, 57
    = (3e + 4e observations) ÷ 2
    = (37 + 47) ÷ 2
    = 42
  5. Écart interquartile = Q3 – Q1
    = 42 – 17
    = 25

On peut résumer ces résultats comme suit :

Un résumé graphique de l'exemple deux.

Nota : Cet exemple renferme un nombre pair d'observations. La médiane, Q2, se situe entre le centre de deux observations (24 et 28); le calcul de Q1 inclut donc l'observation 24, puisqu'elle se situe au-dessous de la valeur de Q2. De même, 28 est aussi inclus dans le calcul de Q3, puisqu'il se situe au-dessus de la valeur de Q2.

Examinons un nombre impair d'observations comme 1, 2, 3, 4, 5, 6, 7. Ici, la valeur de Q2 est 4. Comme la position de la médiane correspond exactement à la quatrième observation, cette valeur n'est pas incluse dans le calcul de Q1 et de Q3, étant donné que nous ne nous intéressons qu'aux données situées au-dessus et au-dessous de Q2. Dans l'exemple ci-dessus, Q1 = 2 et Q3 = 6.

 

Écart semi-interquartile

L'écart semi-interquartile est une autre mesure de dispersion. On le calcule sous la forme d'une moitié de la différence entre le 75e percentile (souvent appelé Q3) et le 25e percentile (Q1). La formule pour calculer l'écart semi-interquartile est la suivante :

(Q3 – Q1) ÷ 2.

Puisque la moitié des valeurs à l'intérieur d'une distribution se situe entre Q3 et Q1, l'écart semi-interquartile représente la moitié de la distance nécessaire pour englober 50 % des valeurs. Dans une distribution symétrique, un intervalle s'étirant d'un écart semi-interquartile au-dessous de la médiane à un écart semi-interquartile au-dessus de la médiane renfermera la moitié des valeurs. Toutefois, cela n'est pas vrai dans le cas d'une distribution asymétrique.

L'écart semi-interquartile n'est guère influencé par des valeurs plus élevées; c'est donc une bonne mesure de dispersion pour les distributions asymétriques. On utilise rarement des écarts semi-interquartiles pour des ensembles de données dont les distributions sont normales. Lorsqu'un ensemble de données comporte une distribution normale, on a plutôt recours à l'écart-type.