5 Visualisation des données
5.6 Nuage de points

Début du texte

En science, le nuage de points est grandement utilisé pour présenter la mesure de deux ou plusieurs variables liées. Le nuage de points est particulièrement utile lorsque les valeurs des variables sur l'axe des y dépendent des valeurs de la variable de l'axe des x.

Dans un nuage de points, les points sont placés sans être reliés. La tendance qui en résulte indique le type et la force de la relation entre deux ou plusieurs variables. Le graphique 5.6.1 est un exemple de nuage de points. Le pourcentage de gens qui possèdent une voiture augmente avec le revenu, ce qui montre une relation positive entre ces deux variables.

Graphique 5.6.1 Possession d’une voiture à Touteville, selon le revenu du ménage

Tableau de données du graphique 5.6.1 
Tableau de données du graphique 5.6.1
Sommaire du tableau
Le tableau montre les résultats de Tableau de données du graphique 5.6.1 . Les données sont présentées selon Revenu ($) (titres de rangée) et Pourcentage (%)(figurant comme en-tête de colonne).
Revenu ($) Pourcentage (%)
20 000 60
30 000 55
40 000 75
50 000 85
60 000 82
70 000 97
80 000 87
90 000 90
100 000 95

La tendance des points du nuage montre la relation entre les variables. Les nuages de points peuvent montrer différentes tendances et relations, par exemple :

  • une relation linéaire ou non linéaire,
  • une relation positive (directe) ou négative (inverse),
  • la concentration ou la dispersion des données,
  • la présence de valeurs extrêmes.

Relation linéaire ou non linéaire

Lorsque les points forment une ligne droite dans le graphique, la relation entre les variables est linéaire, comme dans le graphique 5.6.2, partie A. Lorsque les points ne forment pas de ligne ou forment une ligne qui n’est pas droite comme au graphique 5.6.2, partie B, la relation n’est pas linéaire.

Graphique 5.6.2 Relation linéaire ou relation non linéaire

Tableau de données du graphique 5.6.2 
Tableau de données du graphique 5.6.2
Sommaire du tableau
Le tableau montre les résultats de Tableau de données du graphique 5.6.2 . Les données sont présentées selon Variable X (titres de rangée) et Variable Y1 (Partie A) et Variable Y2 (Partie B)(figurant comme en-tête de colonne).
Variable X Variable Y1 (Partie A) Variable Y2 (Partie B)
0 -3 -2
7 4 -2
13 19 7
20 21 3
27 34 10
33 24 -5
40 42 9
47 45 9
53 58 22
60 58 25
67 71 47
73 78 71
80 77 100
87 85 160
93 90 249
100 99 392

Relation positive ou négative

Si les points sont regroupés près d'une ligne qui va du coin inférieur gauche au coin supérieur droit du graphique, la relation entre les deux variables est dite positive ou directe (graphique 5.6.3, partie A). Si les points sont regroupés près d'une ligne qui va du coin supérieur gauche au coin inférieur droit du graphique, la relation entre les variables est dite négative ou inverse (graphique 5.6.3, partie B).

Graphique 5.6.3 Relation positive ou relation négative

Tableau de données du graphique 5.6.3 
Tableau de données du graphique 5.6.3
Sommaire du tableau
Le tableau montre les résultats de Tableau de données du graphique 5.6.3. Les données sont présentées selon Variable X (titres de rangée) et Variable Y1 (Partie A) et Variable Y2 (Partie B)(figurant comme en-tête de colonne).
Variable X Variable Y1 (Partie A) Variable Y2 (Partie B)
0 -17 83
7 16 103
13 20 93
20 14 74
27 35 81
33 28 62
40 46 66
47 65 72
53 56 49
60 51 31
67 62 29
73 88 42
80 105 45
87 115 42
93 108 21
100 114 14

Concentration ou dispersion des données

Les points peuvent être très près les uns des autres (graphique 5.6.4, partie A) ou être très dispersés dans l’espace (graphique 5.6.4, partie B).

Graphique 5.6.4 Données concentrées ou données dispersées

Tableau de données du graphique 5.6.4 
Tableau de données 5.6.4
Sommaire du tableau
Le tableau montre les résultats de Tableau de données 5.6.4 . Les données sont présentées selon Variable X1 (Partie A) (titres de rangée) et Variable Y1 (Partie A), Variable X2 (Partie B) et Variable Y2 (Partie B)(figurant comme en-tête de colonne).
Variable X1 (Partie A) Variable Y1 (Partie A) Variable X2 (Partie B) Variable Y2 (Partie B)
44 51 4 37
42 51 25 32
48 51 64 60
49 46 15 18
38 46 51 18
41 52 60 54
55 51 20 70
50 58 35 24
54 41 15 55
59 48 47 62
42 49 62 13
55 49 35 6
52 46 60 81
46 57 65 16
55 52 70 65

Présence de valeurs extrêmes

En plus de montrer la relation entre deux variables, un nuage de points peut également montrer si des valeurs extrêmes sont présentes dans l’ensemble de données. Les valeurs extrêmes sont celles qui sont éloignées des autres données de l’ensemble de données, comme les deux points en rouge au graphique 5.6.5.

Graphique 5.6.5 Données extrêmes

Tableau de données du graphique 5.6.5 
Tableau de données du graphique 5.6.5
Sommaire du tableau
Le tableau montre les résultats de Tableau de données du graphique 5.6.5 . Les données sont présentées selon Variable X (titres de rangée) et Variable Y et Symbole(figurant comme en-tête de colonne).
Variable X Variable Y Symbole
0 -1 Cercle noir
7 1 Cercle noir
13 32 Cercle noir
15 83 Triangle rouge (donnée extrême potentielle)
20 28 Cercle noir
27 5 Cercle noir
28 95 Triangle rouge (donnée extrême potentielle)
33 30 Cercle noir
40 46 Cercle noir
47 29 Cercle noir
53 41 Cercle noir
60 46 Cercle noir
67 29 Cercle noir
73 54 Cercle noir
80 52 Cercle noir
87 63 Cercle noir
93 59 Cercle noir
100 82 Cercle noir

Date de modification :