Les statistiques : le pouvoir des données!
4 Exploration des données

Début du texte

À plusieurs étapes du processus de production d’information statistique, il peut être utile d’explorer les données. Cela peut être au moment d’évaluer si une source de données répond à vos besoins, au moment où vous recevez les données brutes et voulez décider du traitement qui sera nécessaire pour pouvoir les utiliser ou avant de réaliser des analyses statistiques plus avancées. Peu importe la source des données, il est important de bien les comprendre et d’identifier les limites. Pour ce faire, vous pouvez vous poser les questions suivantes :

  • Quelles sont les métadonnées disponibles pour cet ensemble de données? Les descriptions des variables sont-elles disponibles?
  • Quelles sont la population observée, l’unité d’observation et la période de référence?
  • S’agit-il de données agrégées ou de microdonnées?
  • De quels types sont les variables présentes dans le fichier?
  • Quelles sont les distributions de fréquences de ces variables? Quelles sont les mesures de tendance centrale et de dispersion?

Cette section commence par la présentation de quelques outils informatiques utiles pour explorer les données. Les différents types de variables sont ensuite présentés, suivis par les statistiques descriptives qui permettent d’explorer les données, c’est-à-dire les tableaux de fréquences et les mesures de tendance centrale et de dispersion.


Date de modification :