Visualisation des données : pratiques exemplaires
Introduction
Bien utilisés, les graphiques (incluant les figures et les diagrammes) peuvent simplifier la présentation d’information et la communication de messages clairs et précis. Devant la vaste gamme d’options offertes, la création de graphiques peut parfois s’avérer complexe. Le présent document se veut un guide de référence pour créer des graphiques efficaces, tirant profit des options disponibles.
Préparation initiale
Avant de créer un graphique, il est pertinent de répondre à quelques questions importantes.
- À quelles données ai-je accès ? Cette question vise à clarifier la nature et l’état des données que l’on souhaite présenter à l’aide d’un graphique. Le type de données, le nombre de variables disponibles et les éventuelles données manquantes influenceront le type de graphique à privilégier et la façon d’y présenter l’information.
- Quel est mon public cible ? Cette question permet d’établir à qui s’adresse principalement le graphique. Les niveaux de connaissance et d’expertise du public cible auront un impact sur la façon de présenter l’information, ainsi que sur le type de graphique et la terminologie à utiliser.
- Quel est le message que je désire présenter ? Les graphiques permettent la transmission rapide et efficace d’un message. Il est essentiel de clairement établir le message à mettre de l’avant. Le type de graphique choisi, le titre et plusieurs autres éléments seront déterminés en fonction du message à communiquer.
- Devrais-je utiliser un graphique ? Les graphiques peuvent être très utiles dans de nombreuses circonstances. Il existe toutefois des situations où il serait préférable de ne pas utiliser de graphique :
- Lorsque les données sont très dispersées;
- Lorsqu’il manque beaucoup de données;
- Lorsque les données sont très homogènes;
- Lorsqu’il y a peu de données;
- Lorsqu’il y a beaucoup de données.
Description de la figure 1
Dans cette image d’un graphique à barres à trois colonnes, le premier point de données est très élevé, tandis que le deuxième et le troisième sont tous deux très bas. Ce large éventail de points de données fait en sorte qu’il est difficile de déterminer les valeurs pour les deuxième et troisième colonnes.
Description de la figure 2
Dans cette image d’un graphique linéaire, il manque des points de données pour plusieurs variables, ce qui réduit la probabilité de cerner des tendances ou des variations au fil du temps.
Description de la figure 3
Dans cette image d’un graphique à barres à 20 colonnes, les 20 barres ont toutes la même couleur et la même hauteur, ce qui rend la visualisation excessivement complexe puisque tous les points de données sont identiques.
Description de la figure 4
Dans cette image d’un graphique circulaire, il n’y a que deux catégories. L’une occupe la quasi-totalité du graphique tandis que l’autre ne représente qu’une très petite partie du graphique, ce qui rend la visualisation excessivement complexe et superflue.
Description de la figure 5
Dans cette image d’un graphique à barres à 47 colonnes, les points de données sont beaucoup trop serrés et sont représentés à l’aide de couleurs qui ne se distinguent pas assez bien les unes des autres pour permettre une interprétation facile.
Composantes des graphiques
Les différents types de graphiques possèdent des composantes communes pour lesquelles il existe des pratiques exemplaires.
Description de la figure 6
L’image montre un diagramme à barres avec des étiquettes et des flèches qui pointes à différents endroits dans le diagramme. Les étiquettes pointent les composantes communes du diagramme soit le titre, les axes, les coches, le quadrillage, la légende, la remarque, la source et les couleurs.
1. Titre
Le titre apparaît généralement en en-tête d’un graphique et fait partie de ce dernier. Les différents axes du graphique peuvent également avoir des titres distincts.
- Le titre du graphique peut être descriptif (p. ex. inclure les variables et périodes couvertes) ou informatif (p. ex. préciser le message véhiculé par le graphique).
- Le titre des axes devrait être descriptif.
- Le titre devrait être clair et aider le lecteur à mieux comprendre les données présentées.
- Le graphique, incluant son titre, devrait être considéré comme étant distinct du texte. Au besoin, les acronymes utilisés devraient être redéfinis.
- Si les données réfèrent à une unité de mesure précise, cette dernière peut être incluse dans le titre du graphique ou de l’axe.
2. Axes
Certains types de graphiques utilisent des axes pour présenter les données.
- Les titres des axes ne sont pas toujours nécessaires, à moins qu’il y ait une unité de mesure précise.
- Sauf exceptions, les axes devraient débuter à zéro et ne pas être brisés.
3. Marques de graduation
Les marques de graduation fournissent des repères visuels facilitant la lecture des données.
- Il devrait y avoir un équilibre dans l’utilisation des marques de graduation. Trop de marques de graduation encombreront l’axe tandis que trop peu complexifieront la lecture des données.
- Les intervalles devraient être réguliers, tels que des bonds de 10, 100, 1 000 ou 1 000 000.
- Les marques de graduation devraient toujours apparaître dans la zone de traçage du graphique.
- Les marques de graduation ne devraient pas être utilisées simultanément avec des lignes de quadrillage.
4. Lignes de quadrillage
Les lignes de quadrillage apparaissent sur certains types de graphiques, afin notamment de faciliter la lecture et la comparaison des valeurs.
- Les lignes devrait être minces, pâles et placées derrière les éléments présentant les données.
- L’espace entre les lignes devrait être suffisant pour faciliter la lecture des données, sans encombrer le graphique.
- Les lignes de quadrillage ne devraient pas être utilisées simultanément avec des marques de graduation.
5. Légende
Une légende peut être utilisée pour étiqueter les différentes variables ou catégories présentées dans un graphique. Elle peut être particulièrement utile lorsqu’il y a plusieurs éléments.
- La légende devrait apparaître près des objets qu’elle étiquette, sans interférer avec les données.
- La légende devrait être plus petite que les objets qu’elle étiquette.
- Une légende devrait toujours être utilisée s’il y a des catégories de données multiples (avec des couleurs différentes).
6. Notes
Les notes peuvent être utilisées pour apporter des précisions au graphique, telles que des considérations méthodologiques, des limites ou une description des abréviations utilisées.
- Les notes de bas de page devraient être numérotées, alors que pour les notes de tableau, le tout est optionnel.
- Les notes devraient être brèves et précises.
- Selon l’auditoire, les notes peuvent être utilisées pour préciser les termes techniques utilisés.
7. Sources
Un graphique devrait toujours inclure les sources des données utilisées.
- Les sources de données devraient être suffisamment précises pour permettre aux utilisateurs de retrouver les données originales, au besoin.
- Si une source de données est fréquemment mise à jour (p. ex. taux de change entre deux devises), il est important de préciser la date d’extraction des données.
8. Couleurs
Les couleurs peuvent être utilisées pour faciliter la compréhension des données, mettre l’emphase sur des éléments spécifiques ou communiquer rapidement certains messages.
- Pour faciliter la visualisation des données, il est recommandé d’utiliser des couleurs contrastant avec la couleur de fond du graphique.
- Les couleurs devraient être utilisées seulement lorsque nécessaires, pour atteindre un objectif de communication précis.
- Des couleurs différentes devraient être utilisées seulement lorsqu’elles correspondent à des significations différentes.
- Lorsque des teintes d’une même couleur sont utilisées, un espace adéquat devrait séparer les teintes afin de bien les différencier.
- Des couleurs pâles et naturelles devraient être utilisées pour présenter la plupart des données. Par contre, on privilégiera plutôt des couleurs vives ou foncées pour les données sur lesquelles on veut attirer l’attention.
- Lorsque l’on veut présenter des valeurs différentes pour une même variable, il est préférable d’utiliser une seule couleur, mais en variant l’intensité (teinte plus pâle pour les valeurs faibles et plus foncée pour les valeurs élevées).
- Des combinaisons de couleurs facilitant la lecture pour les personnes ayant des problèmes à percevoir les couleurs devraient être utilisées (p. ex. les daltoniens).
- Des motifs peuvent être utilisés en remplacement des couleurs, lorsque nécessaire.
Description de la figure 7
L’image est un graphique à trois barres où les trois barres sont d’un bleu très clair et ne contrastent pas avec la couleur d’arrière-plan du graphique.
Description de la figure 8
L’image est un graphique à quatre barres. La couleur de chaque barre correspond à la couleur préférée qu'elle représente.
Description de la figure 9
L’image est un graphique à trois barres où chacune des trois barres représente la même variable, mais pour trois années différentes. Les barres illustrant des résultats supérieurs à zéro sont en vert alors que celle illustrant un résultat négatif est en rouge.
Description de la figure 10
L’image est un graphique à six barres où cinq barres sont bleues et la sixième est aussi bleue, mais ce bleu est beaucoup plus foncé. Cela vise à attirer l’attention sur le fait que la valeur de la sixième année est plus de six fois supérieure à celle de toute autre année.
Description de la figure 11
L’image est une carte du Canada, où chaque province est colorée d’une nuance de bleu, selon la proportion qu’elle représente. Le bleu le plus clair représente les proportions les plus faibles et le bleu le plus foncé, les proportions les plus élevées.
Description de la figure 12
Dans cette image d’un graphique linéaire, il y a cinq années représentées par cinq lignes. Au lieu d’utiliser des couleurs différentes pour différencier les années, on a utilisé des formes, à savoir un cercle, un triangle, un carré et la lettre X, pour représenter les points de données au fil du temps.
9. Autres considérations
- Privilégier la simplicité, en évitant de surcharger les graphiques.
- Sauf exception, éviter les graphiques en 3D qui sont plus difficiles à interpréter.
- Pour promouvoir l’accessibilité aux données, des notes devraient être utilisées lorsque des éléments ne faisant pas partie du tableau de données apparaissent sur le graphique.
Description de la figure 13
Dans cette image d’un graphique à barres à 14 colonnes, les points de données sont trop serrés et sont représentés à l’aide de couleurs qui ne se distinguent pas assez bien les unes des autres, les valeurs numériques se chevauchent et plusieurs années sont représentées. Le graphique est trop chargé pour permettre une interprétation facile.
Description de la figure 14
Cette image est un graphique à barres en 3D de 4 colonnes de largeur et de trois colonnes de profondeur. Plusieurs des colonnes des deux dernières rangées de données sont plus petites que celles de la première rangée, ce qui rend les données difficiles à interpréter.
Types de graphiques
Il existe plusieurs types de graphiques, chacun présentant des avantages et désavantages, selon le contexte et la nature des données. La sélection du bon type de graphique sera influencée par différents facteurs tels que le type des données, les messages à communiquer et le public cible.
1. Diagramme en secteurs
Un diagramme en secteurs présente la répartition en pourcentage d’une variable donnée. Chaque segment représente une catégorie et sa taille est proportionnelle au poids de cette dernière dans le total.
Description de la figure 15
Cette image est un graphique circulaire de trois catégories où la somme des trois catégories correspond à 100 %.
- Un diagramme en secteurs ne peut être utilisé que pour les données où la somme des différentes catégories totalise 100 %.
- Idéalement, un diagramme en secteurs compte entre deux et six catégories différentes.
- Les catégories devraient être présentées en ordre décroissant dans le sens des aiguilles d’une montre.
- Il n’est pas possible de présenter l’incertitude sur un diagramme en secteurs.
Description de la figure 16
Cette image est un graphique circulaire de trois catégories où la somme des trois catégories correspond à plus de 100 %.
Description de la figure 17
Cette image est un graphique circulaire de 10 catégories, ce qui rend les données difficiles à interpréter visuellement.
Description de la figure 18
Cette image est un graphique circulaire de cinq catégories où les catégories ne sont pas présentées par ordre décroissant.
Famille des diagrammes en secteurs
A. Diagramme à barres de secteur
Description de la figure 19
Cette image est un graphique circulaire de quatre catégories où la catégorie « Autre » est représentée par un graphique à barres empilées de deux catégories à droite du graphique circulaire.
Un diagramme à barres de secteur peut être utilisé lorsqu’il y a plus de six catégories ou lorsqu’il y a plusieurs petites catégories difficiles à illustrer clairement dans un diagramme en secteurs ordinaire. Dans ce dernier cas, ces petites catégories sont groupées sous une nouvelle catégorie « Autre » insérée dans le diagramme principal. Des barres empilées présentent ces petites catégories à côté du diagramme en secteurs principal.
B. Diagramme en anneau
Description de la figure 20
Cette image est un graphique en anneau de quatre catégories où chaque catégorie est représentée non seulement par une couleur différente, mais aussi par un logo différent.
Un diagramme en anneau est un diagramme en secteurs avec un trou au centre. Le trou complexifie l’estimation de la taille relative des catégories, mais peut être utilisé pour présenter une information pertinente, tel un logo.
2. Diagramme à barres
Un diagramme à barres utilise des barres pour représenter les différentes catégories. Il peut être vertical ou horizontal et est composé de deux axes. Le nom des différentes catégories est indiqué sur un axe ou à l’aide d’étiquettes sur les barres. La valeur des données est représentée sur l’autre axe : c’est ce qu’on appelle l’échelle.
Description de la figure 21
Cette image est un graphique à barres horizontales de cinq catégories où les titres sont sur l’axe des Y et les pourcentages sur l’axe des X.
- Un diagramme à barres verticales fournit plus d’espace pour les noms des catégories.
- Si l’objectif est de mettre l’accent sur l’ordre de grandeur des différentes catégories, présenter ces dernières en ordre croissant ou décroissant. Ne pas modifier l’ordre des catégories ayant un ordre naturel, tel que les mois ou les années par exemple.
- Idéalement, un diagramme à barres compterait entre deux et dix catégories différentes.
- Lorsque les données comportent un élément temporel, ce dernier devrait être présenté chronologiquement sur l’axe des X, de gauche à droite.
- Il est possible de présenter l’incertitude sur un diagramme à barres.
Description de la figure 22
Cette image est un graphique à barres verticales de cinq catégories où les titres sont sur l’axe des x et les pourcentages sur l’axe des Y.
Description de la figure 23
Cette image est un graphique à barres incluant cinq catégories où les données annuelles sont présentées en ordre chronologique, de gauche à droite.
Description de la figure 24
Cette image est un graphique à barres de cinq catégories qui affiche une plage d’incertitude en haut de chaque barre.
Famille des diagrammes à barres
A. Diagrammes à barres groupées
Il est possible de présenter deux séries ou plus de données dans un diagramme à barres groupées. Cependant, plus il y a de séries, plus il est difficile de se concentrer sur une seule série à la fois.
Description de la figure 25
Cette image est un graphique à barres groupées qui affiche des données pour quatre catégories sur trois ans. Chaque année est représentée comme un regroupement des 4 mêmes catégories.
B. Histogrammes
L’histogramme permet d’illustrer le sommaire d’une variable continue mesurée sur une échelle d’intervalles. Dans un histogramme, les barres sont reliées les unes aux autres, sans espace entre elles.
Description de la figure 26
Cette image est un histogramme de sept catégories.
C. Tracés en boîte
Le tracé en boîte permet d’illustrer la répartition des différentes catégories d’une variable. Chaque barre commence à la valeur minimale et se termine à la valeur maximale de la catégorie. Il y a habituellement une ligne épaisse à l’intérieur de chaque barre indiquant le centre de la répartition, généralement la médiane.
Description de la figure 27
Cette image est un diagramme en boîte de deux catégories.
D. Diagrammes de quartiles
Ce type de diagramme est l’un des plus efficaces pour illustrer la distribution de fréquences des variables, puisqu’il affiche la valeur minimale, le premier quartile, la médiane, le troisième quartile et la valeur maximale d’une catégorie. Il est également utile pour illustrer la distribution d’une variable continue.
Description de la figure 28
Cette image est un diagramme de quartiles de deux catégories.
E. Diagrammes à barres empilées
Le diagramme à barres empilées permet d’illustrer les valeurs totales des différentes catégories. De plus, chaque barre est ventilée pour présenter les sous-éléments de chaque catégorie. Comme la valeur de référence des sous-catégories varie d’une barre à l’autre, seul le premier sous-élément peut être visualisé efficacement.
Description de la figure 29
Cette image est un graphique à barres empilées de quatre catégories qui affiche des données pour deux ans.
F. Diagrammes à barres empilées à 100 %
Le diagramme à barres empilées à 100 % est utilisé pour illustrer le rapport entre les sous-catégories. Il est semblable au diagramme à barres empilées, mais présente la valeur relative de chaque catégorie plutôt que la valeur absolue.
Description de la figure 30
Cette image est un graphique à barres empilées à 100 % de quatre catégories qui affiche des données pour deux ans.
G. Diagrammes en cascade
Le diagramme en cascade sépare les parties d’un diagramme à barres empilées et présente chaque sous-élément séparément. La première barre débute à partir de la valeur de base naturelle, tandis que les autres barres débutent à partir de la valeur de la barre précédente et peuvent avoir une valeur positive ou négative.
Description de la figure 31
Cette image est un graphique en cascade de quatre catégories.
3. Diagramme linéaire
Contrairement au diagramme à barres, qui met l’accent sur les valeurs individuelles, le diagramme linéaire souligne la continuité et l’évolution d’un point à l’autre. On l’utilise couramment pour présenter les changements et les tendances au fil du temps.
Description de la figure 32
Cette image est un graphique linéaire qui affiche des données sur quatre ans.
- Il est possible d’utiliser des points sur la ligne pour mettre l’accent sur les valeurs.
- Des espaces ou des lignes pointillées peuvent être utilisés lorsque des données sont manquantes.
- Lorsque plusieurs éléments sont présentés sur un même graphique, ils doivent avoir la même unité de mesure, mais des couleurs différentes pour les distinguer. Les lignes devraient également être visuellement distinctes.
- Une ligne différente (p. ex. pointillée ou d’une couleur différente) devrait être utilisée pour distinguer les données réelles des tendances, des projections et des cibles.
- De l’ombrage peut être utilisé pour présenter l’incertitude.
Description de la figure 33
Ceci est un doublon de l’image précédente. Il s’agit d’un graphique linéaire qui affiche des données sur quatre ans.
Description de la figure 34
Cette image est un graphique linéaire qui affiche des données sur 10 ans avec un espace où les données sont manquantes pour l’année 4.
Description de la figure 35
Cette image est un graphique linéaire de 3 catégories qui affiche des données sur 10 ans. Chaque ligne est d’une couleur différente pour différencier les éléments mesurés les uns des autres.
Description de la figure 36
Cette image est un graphique linéaire qui affiche des données sur 10 ans, et la ligne est pointillée des années 8 à 10 pour montrer l’incertitude.
Famille des diagrammes linéaires
A. Diagramme linéaire groupé
Il est possible de présenter deux séries ou plus de données dans un diagramme linéaire groupé. Cependant, plus on ajoute des séries, plus il devient difficile de se concentrer sur une seule série à la fois.
Description de la figure 37
Cette image est un graphique linéaire de 3 catégories qui affiche des données sur 10 ans. Chaque ligne est d’une couleur différente pour différencier les éléments mesurés les uns des autres.
B. Diagramme de pentes
Le diagramme de pentes illustre l’augmentation ou la diminution relative d’un ensemble de variables entre deux points de données. Il présente un ordre visuel clair parmi les variables et peut être utilisé pour illustrer un classement.
Description de la figure 38
Cette image est un diagramme de pente qui affiche des données pour trois catégories sur deux ans.
4. Diagramme par points
On utilise généralement les diagrammes par points pour illustrer la tendance ou le modèle de distribution de fréquences des variables. Les nuages de points comportent habituellement un élément supplémentaire, c.-à-d. une ligne de régression qui illustre la pente estimée d’un modèle.
- Il est important que les différents points puissent être clairement distingués les uns des autres.
- Des points de différentes grosseurs peuvent être utilisés pour représenter des valeurs différentes. En cas de chevauchement, les plus petits points devraient être placés devant les autres afin d’être visibles.
- La taille relative des points de différentes grosseurs peut être difficile à estimer.
- Le diagramme par points attire l’attention du lecteur sur les points et leurs valeurs. Si l’objectif est d’illustrer une tendance, il est préférable de relier les points et de créer un diagramme linéaire.
- De l’ombrage autour des points peut être utilisé pour présenter l’incertitude.
Description de la figure 39
Il s’agit d’une image de sept points dans un diagramme par points qui affiche les données selon l’âge sur l’axe des X et selon le revenu sur l’axe des Y.
Description de la figure 40
Il s’agit d’une image de sept bulles affichées dans un diagramme par points. Les bulles sont de tailles variables, ce qui représente la valeur d’une troisième variable.
Famille des diagrammes par points
A. Diagramme en suçons
Ce diagramme est semblable au diagramme à barres. Il utilise toutefois une ligne pour illustrer les valeurs de chaque variable au lieu d’une barre.
Description de la figure 41
L’image est un graphique en suçons qui affiche 12 suçons au total, un pour chaque mois de l’année.
B. Diagramme à bandes
Le diagramme à bandes permet de présenter la valeur de chaque point dans un ensemble de données. Il est utile pour illustrer la valeur précise de chaque élément d’un petit ensemble de données.
Description de la figure 42
Cette image est un graphique à bandes.
C. Diagramme à bulles
Le diagramme à bulles permet d’illustrer un troisième élément sur un même diagramme, à l’aide de bulles dont la taille varie selon la valeur.
Description de la figure 43
Il s’agit d’une image de sept bulles affichées dans un graphique à bulles. Les bulles sont de tailles variables, ce qui représente la valeur d’une troisième variable.
5. Carte
Une carte est une conception géospatiale présentant de l’information sur des emplacements géographiques.
Description de la figure 44
Cette image est une carte du Canada où différentes nuances de couleur sont assignées à des régions définies.
La « carte choroplèthe » utilise des couleurs pour fournir de l’information : différentes nuances de couleur sont attribuées à des régions définies comme des pays, des provinces ou des villes.
- Avec une carte choroplèthe, il est préférable d’utiliser des mesures relatives pour attribuer les couleurs aux éléments, plutôt que des mesures absolues.
- Sur une carte choroplèthe, il peut être difficile de distinguer de petites régions, telles que l’Île-du-Prince-Édouard sur une carte du Canada.
- Il n’est pas possible de présenter l’incertitude sur une carte.
Famille des cartes
A. Carte proportionnelle
Ce type de carte utilise des rectangles proportionnels à la taille relative de chaque catégorie pour illustrer ces dernières.
Description de la figure 45
Cette image est une carte proportionnelle de cinq catégories qui affiche des rectangles proportionnels à la taille relative de chacune des cinq catégories.
B. Carte quadrillée
Dans une carte géographique traditionnelle, la taille de chaque région influence la façon dont l’information est traitée. Dans une carte quadrillée, des éléments de taille et de forme identiques sont utilisés ce qui permet au lecteur de voir et traiter l’information sans influence de la taille.
Description de la figure 46
Cette image est une carte quadrillée.
Glossaire
Valeur de base
La valeur de base (aussi appelée « ligne de base ») est le point de départ naturel d’une variable. Habituellement, la valeur de base des variables est zéro, mais il y a des cas où la valeur de base logique est différente (p. ex. l’indice de prix a une valeur de base de 1).
Incertitude
En statistique, l’incertitude fait référence au fait que les estimations provenant d’un échantillon ou d’une projection peuvent ne pas correspondre exactement à la valeur réelle.
Variable continue
Une variable continue peut prendre toutes les valeurs possibles d’un intervalle prédéfini, par opposition aux variables discrètes, qui ne peuvent prendre que certaines valeurs d’un intervalle, généralement les nombres entiers.
- Date de modification :