4 Exploration des données
4.1 Outils d'exploration des données

Début du texte

Les logiciels de production de graphiques, de programmation, de base de données et de tabulation sont régulièrement utilisés pour explorer les données. En voici quelques exemples :

  • Les tableurs sont des programmes qui permettent d’additionner des colonnes et des lignes de nombres, de calculer des moyennes et de réaliser des analyses descriptives. On peut s’en servir pour produire des tableaux sommaires des résultats. Les tableurs permettent aussi de produire des graphiques pour mieux comprendre les relations entre les variables. Ceux-ci se présentent sous des formes diverses : graphiques à barresgraphiques linéairesgraphiques circulaires, pour ne nommer que quelques exemples de visualisations des données.
  • Les données sont parfois sauvegardées dans des bases de données pour en faciliter l’accès et permettre la production de sommaires, de données agrégées et de rapports. Un logiciel de base de données devrait être en mesure d’enregistrer, de récupérer, de trier et d’analyser des données.
  • Les programmes spécialisés peuvent servir à vérifier, à nettoyer, à imputer et à traiter le tableau final. Ils offrent tous les services en un seul module et peuvent servir après chaque cycle de la même enquête saisie dans le système. Ces programmes produisent par la suite les résultats prêts à être publiés.
  • Les logiciels statistiques permettent à la fois de traiter les données, de produire des résultats sommaires et des visualisations, mais ils permettent en plus de réaliser des analyses statistiques avancées comme des modélisations.

Un exemple d’outil très populaire pour explorer les données est le logiciel R. Il s’agit d’un langage de programmation et d’un logiciel libre que tous peuvent télécharger et installer sur leur ordinateur pour manipuler, explorer et analyser les données. Les graphiques présentés dans les prochaines sections ont tous été créés à l’aide de R.

Les résultats obtenus à l’aide de ces différents outils peuvent servir de nombreuses façons. Ils peuvent être enregistrés en vue d’une récupération et d’une utilisation ultérieure, être transmis à d’autres équipes sous forme de fichiers électroniques ou être diffusés sur le web pour communiquer l’information statistique à ceux qui en ont besoin. Il s’agit généralement d’un auditoire précis et la transmission des résultats doit être pensée en fonction de ces utilisateurs. Il faut répondre aux questions suivantes :

  • À qui sont destinés les résultats produits?
  • Sous quel format les résultats seront-ils mieux compris?

Date de modification :