Intégration de l’apprentissage automatique au codage du Recensement canadien de 2021 à l’aide de fastText - ARCHIVÉ
Articles et rapports : 11-522-X202100100010
Dans le cadre du traitement du recensement canadien de 2021, les réponses en toutes lettres aux 31 questions du recensement doivent être codées. Jusqu’en 2016, il s’agissait d’un processus en trois étapes, dont une deuxième étape de « codage interactif (humain) ». Cette étape de codage humain est à la fois longue et coûteuse, s’étalant sur de nombreux mois et nécessitant le recrutement et la formation d’un grand nombre d’employés temporaires. Dans cette optique, pour 2021, cette étape sera soit complétée ou entièrement remplacée par des modèles d’apprentissage automatique à l’aide de l’algorithme « fastText ». Dans cette présentation, nous discuterons de la mise en place de cet algorithme ainsi que des défis et des décisions prises en cours de route.
Mots clés : traitement du langage naturel, apprentissage automatique, fastText, codage
Produit principal : La série des symposiums internationaux de Statistique Canada : recueil
Format | Date de sortie | Informations supplémentaires |
---|---|---|
5 novembre 2021 |
Information connexe
Sujets et mots-clés
Sujets
Mots-clés
- Date de modification :