4 Exploration des données
4.2 Types de variables
Début du texte
Une variable est une caractéristique mesurable qui peut prendre différentes valeurs. La taille, l’âge, le revenu, la province ou le pays de naissance, les années d’études et le type de logement sont tous des exemples de variables. Les variables peuvent être classées en deux catégories principales : les catégoriques et les variables numériques. Chacune des catégories se sépare en deux sous-catégories : nominale et ordinales pour les variables catégoriques, discrètes et continues pour les variables numériques. Ces types sont définis brièvement dans cette section.
Variables catégoriques
Une variable catégorique (aussi appelée variable qualitative) réfère à une caractéristique qui n’est pas quantifiable. Une variable catégorique peut être nominale ou ordinale.
Variables nominales
Une variable nominale décrit un nom, une étiquette ou une catégorie sans ordre naturel. Le sexe et le genre de logement en sont des exemples. Dans le tableau 4.2.1, la variable « Mode de transport pour se rendre au travail » est également une variable nominale.
Mode de transport pour se rendre au travail | Nombre de personnes |
---|---|
Automobile, camion ou fourgonnette (conducteur) | 9 929 470 |
Automobile, camion ou fourgonnette (passager) | 923 975 |
Transport en commun | 1 406 585 |
À pied | 881 085 |
Bicyclette | 162 910 |
Autres moyens | 146 835 |
Variables ordinales
Une variable ordinale est une variable dont les valeurs sont définies par une relation d’ordre entre les catégories possibles. Dans le tableau 4.2.2, la variable « comportement » est ordinale parce que la catégorie « Excellent » est meilleure que la catégorie « Très bon », qui est elle-même meilleure que la catégorie « Bon » et ainsi de suite. On y trouve un certain ordre naturel, mais celui-ci est limité par le fait que nous ne savons pas dans quelle mesure le comportement « Excellent » est meilleur que le comportement « Très bon » par exemple.
Comportement | Nombre d’élèves |
---|---|
Excellent | 5 |
Très bon | 12 |
Bon | 10 |
Mauvais | 2 |
Très mauvais | 1 |
Il est important de noter que bien que les variables catégoriques ne soient pas quantifiables, elles peuvent apparaître sous forme de nombre dans un ensemble de données. La correspondance entre ces nombres et les catégories correspondantes est établie au cours du codage des données. Pour bien identifier les types de variables, il faut donc s’assurer de disposer des métadonnées (les données à propos des données) qui doivent inclure les ensembles de codes utilisés pour chaque variable catégorique. Par exemple, les catégories présentées dans le tableau 4.2.2 pourraient apparaître sous forme d’un nombre allant de 1 à 5 : 1 pour « très mauvais », 2 pour « mauvais », 3 pour « bon », 4 pour « très bon » et 5 pour « excellent ».
Variables numériques
Une variable numérique (aussi appelée variable quantitative) est une caractéristique quantifiable dont les valeurs sont des nombres, à l’exclusion des nombres qui correspondent en fait à des codes. Les variables numériques peuvent être continues ou discrètes.
Variables continues
On dit qu’une variable est continue si elle prend un nombre infini de valeurs réelles possibles à l’intérieur d’un intervalle donné. Prenons la taille d’un élève par exemple. La taille ne peut pas prendre n’importe quelle valeur. Elle ne peut pas être négative, ni être plus grande que trois mètres. Mais le nombre de valeurs possibles que peut prendre la taille est théoriquement infini. Un élève pourrait mesurer 1,632 174 875 5… mètres par exemple. Il s’agit donc d’une variable continue. En pratique, les méthodes utilisées ou la précision des instruments employés pour mesurer une variable continue en restreignent la précision. La taille rapportée sera arrondie au centimètre près, soit 1,63 m. L’âge est un autre exemple de variable continue qui est le plus souvent rapportée en arrondissant à l’entier inférieur.
Variables discrètes
Contrairement à une variable continue, une variable discrète ne peut prendre qu’un nombre fini de valeurs réelles possibles à l’intérieur d’un intervalle donné. La note accordée par un juge à un gymnaste lors d’une compétition est un exemple de variable discrète : la plage varie de 0 à 10 et la note ne comporte jamais plus qu’une décimale (p. ex., une note de 8,5). On peut donc énumérer toutes les valeurs possibles (0, 0,1, 0,2…) et constater que le nombre de valeurs possibles est fini : il est de 101! Un autre exemple est la taille du ménage. Prenons les ménages qui ont 20 personnes ou moins. Le nombre de valeurs possibles dans cet intervalle sera de 20, car on sait qu’il n’est pas possible pour un ménage d’inclure un nombre de personnes qui serait une fraction d’un nombre entier comme 2,27 par exemple.
- Date de modification :