4 Exploration des données
4.2 Types de variables

Début du texte

Une variable est une caractéristique mesurable qui peut prendre différentes valeurs. La taille, l’âge, le revenu, la province ou le pays de naissance, les années d’études et le type de logement sont tous des exemples de variables. Les variables peuvent être classées en deux catégories principales : les catégoriques et les variables numériques. Chacune des catégories se sépare en deux sous-catégories : nominale et ordinales pour les variables catégoriques, discrètes et continues pour les variables numériques. Ces types sont définis brièvement dans cette section.

Variables catégoriques

Une variable catégorique (aussi appelée variable qualitative) réfère à une caractéristique qui n’est pas quantifiable. Une variable catégorique peut être nominale ou ordinale.

Variables nominales

Une variable nominale décrit un nom, une étiquette ou une catégorie sans ordre naturel. Le sexe et le genre de logement en sont des exemples. Dans le tableau 4.2.1, la variable « Mode de transport pour se rendre au travail » est également une variable nominale.


Tableau 4.2.1
Mode de transport habituel utilisé par les Canadiens pour se rendre au travail
Sommaire du tableau
Le tableau montre les résultats de Mode de transport habituel utilisé par les Canadiens pour se rendre au travail. Les données sont présentées selon Mode de transport pour se rendre au travail (titres de rangée) et Nombre de personnes(figurant comme en-tête de colonne).
Mode de transport pour se rendre au travail Nombre de personnes
Automobile, camion ou fourgonnette (conducteur) 9 929 470
Automobile, camion ou fourgonnette (passager) 923 975
Transport en commun 1 406 585
À pied 881 085
Bicyclette 162 910
Autres moyens 146 835

Variables ordinales

Une variable ordinale est une variable dont les valeurs sont définies par une relation d’ordre entre les catégories possibles. Dans le tableau 4.2.2, la variable « comportement » est ordinale parce que la catégorie « Excellent » est meilleure que la catégorie « Très bon », qui est elle-même meilleure que la catégorie « Bon » et ainsi de suite. On y trouve un certain ordre naturel, mais celui-ci est limité par le fait que nous ne savons pas dans quelle mesure le comportement « Excellent » est meilleur que le comportement « Très bon » par exemple.


Tableau 4.2.2
Classement des élèves selon le comportement
Sommaire du tableau
Le tableau montre les résultats de Classement des élèves selon le comportement. Les données sont présentées selon Comportement (titres de rangée) et Nombre d’élèves(figurant comme en-tête de colonne).
Comportement Nombre d’élèves
Excellent 5
Très bon 12
Bon 10
Mauvais 2
Très mauvais 1

Il est important de noter que bien que les variables catégoriques ne soient pas quantifiables, elles peuvent apparaître sous forme de nombre dans un ensemble de données. La correspondance entre ces nombres et les catégories correspondantes est établie au cours du codage des données. Pour bien identifier les types de variables, il faut donc s’assurer de disposer des métadonnées (les données à propos des données) qui doivent inclure les ensembles de codes utilisés pour chaque variable catégorique. Par exemple, les catégories présentées dans le tableau 4.2.2 pourraient apparaître sous forme d’un nombre allant de 1 à 5 : 1 pour « très mauvais », 2 pour « mauvais », 3 pour « bon », 4 pour « très bon » et 5 pour « excellent ».

Variables numériques

Une variable numérique (aussi appelée variable quantitative) est une caractéristique quantifiable dont les valeurs sont des nombres, à l’exclusion des nombres qui correspondent en fait à des codes. Les variables numériques peuvent être continues ou discrètes.

Variables continues

On dit qu’une variable est continue si elle prend un nombre infini de valeurs réelles possibles à l’intérieur d’un intervalle donné. Prenons la taille d’un élève par exemple. La taille ne peut pas prendre n’importe quelle valeur. Elle ne peut pas être négative, ni être plus grande que trois mètres. Mais le nombre de valeurs possibles que peut prendre la taille est théoriquement infini. Un élève pourrait mesurer 1,632 174 875 5… mètres par exemple. Il s’agit donc d’une variable continue. En pratique, les méthodes utilisées ou la précision des instruments employés pour mesurer une variable continue en restreignent la précision. La taille rapportée sera arrondie au centimètre près, soit 1,63 m. L’âge est un autre exemple de variable continue qui est le plus souvent rapportée en arrondissant à l’entier inférieur.

Variables discrètes

Contrairement à une variable continue, une variable discrète ne peut prendre qu’un nombre fini de valeurs réelles possibles à l’intérieur d’un intervalle donné. La note accordée par un juge à un gymnaste lors d’une compétition est un exemple de variable discrète : la plage varie de 0 à 10 et la note ne comporte jamais plus qu’une décimale (p. ex., une note de 8,5). On peut donc énumérer toutes les valeurs possibles (0, 0,1, 0,2…) et constater que le nombre de valeurs possibles est fini : il est de 101! Un autre exemple est la taille du ménage. Prenons les ménages qui ont 20 personnes ou moins. Le nombre de valeurs possibles dans cet intervalle sera de 20, car on sait qu’il n’est pas possible pour un ménage d’inclure un nombre de personnes qui serait une fraction d’un nombre entier comme 2,27 par exemple.


Date de modification :