Besoin de vitesse : Utilisation de fastText (apprentissage automatique) afin de coder l'Enquête sur la population active - ARCHIVÉ

Articles et rapports : 11-522-X202100100013

Description : L’Enquête sur la population active (EPA) de Statistique Canada joue un rôle fondamental dans le mandat de Statistique Canada. L’information sur le marché du travail fournie par l’EPA est l’une des mesures les plus actuelles et les plus importantes du rendement global de l’économie canadienne. Le codage de l'industrie du répondant selon le Système de classification des industries de l'Amérique du Nord (SCIAN), de la profession selon le Système de classification nationale des professions (CNP) et de la principale catégorie de travailleurs (PCDT) fait partie intégrante du traitement mensuel des données de l'EPA. Chaque mois, jusqu'à 20 000 enregistrements sont codés manuellement. En 2020, Statistique Canada a travaillé au développement de modèles d'apprentissage automatique utilisant fastText afin de coder les réponses au questionnaire de l'EPA selon les trois classifications mentionnées précédemment. Le présent article donnera un aperçu de la méthodologie développée et des résultats obtenus à partir d'une application potentielle de l'utilisation de fastText dans le processus de codage de l’EPA.

Mots clés : apprentissage automatique; Enquête sur la population active; classification de texte; fastText.


Numéro d'exemplaire : 2021001
Auteur(s) : Oyarzun, Javier; Evans, Justin
FormatDate de sortieInformations supplémentaires
PDF5 novembre 2021