Intégration de l’apprentissage automatique au codage du Recensement canadien de 2021 à l’aide de fastText - ARCHIVÉ

Articles et rapports : 11-522-X202100100010

Description :

Dans le cadre du traitement du recensement canadien de 2021, les réponses en toutes lettres aux 31 questions du recensement doivent être codées. Jusqu’en 2016, il s’agissait d’un processus en trois étapes, dont une deuxième étape de « codage interactif (humain) ». Cette étape de codage humain est à la fois longue et coûteuse, s’étalant sur de nombreux mois et nécessitant le recrutement et la formation d’un grand nombre d’employés temporaires. Dans cette optique, pour 2021, cette étape sera soit complétée ou entièrement remplacée par des modèles d’apprentissage automatique à l’aide de l’algorithme « fastText ». Dans cette présentation, nous discuterons de la mise en place de cet algorithme ainsi que des défis et des décisions prises en cours de route.

Mots clés : traitement du langage naturel, apprentissage automatique, fastText, codage

Numéro d'exemplaire : 2021001
Auteur(s) : Stelmack, Andrew
FormatDate de sortieInformations supplémentaires
PDF5 novembre 2021