La science des données collaborative au sein du gouvernement du Canada : création de bibliothèques R pour des tâches communes avec des données du Canada ouvertes

Articles et rapports : 11-522-X202100100028
Description :

De nombreux groupes du gouvernement du Canada développent des codes permettant de traiter et visualiser diverses sortes de données, déployant souvent les mêmes efforts, avec une efficacité sous-optimale et un niveau limité d’examen de la qualité du code. Le présent article présente de façon informelle une méthode de travail visant à traiter ce problème technique. L’idée est de collaborer à la conception d’un dépôt commun de codes et une base de connaissances utilisables par toute personne du secteur public pour accomplir de nombreuses tâches courantes en science des données et, ce faisant, de s’aider mutuellement à maîtriser à la fois les compétences de codage en science des données et les pratiques de collaboration normalisées de l’industrie. L’article explique pourquoi le langage R est utilisé comme langage de prédilection dans le développement de codes en science des données collaborative. Il résume les avantages de R, mais aussi ses limites, établit la taxonomie des sujets de discussion qui intéressent le plus les scientifiques des données du GC travaillant avec R, donne un aperçu des plateformes collaboratives utilisées, et présente les résultats obtenus à ce jour. Bien que la base de connaissances sur les codes soit élaborée principalement en R, elle se veut également utile pour les scientifiques des données qui codent en Python et d’autres environnements de développement. Mots-clés : collaboration; science des données; ingénierie des données; R; gouvernement ouvert; données ouvertes; science ouverte.

Numéro d'exemplaire : 2021001
Auteur(s) : Gorodnichy, Dmitry; Little, Patrick
Produit principal : La série des symposiums internationaux de Statistique Canada : recueil
Format Date de sortie Informations supplémentaires
PDF octobre 29 2021

Information connexe

Sujets et mots-clés

Sujets