Techniques d’enquête
Classification semi-automatisée des réponses à des questions ouvertes à étiquettes multiples

par Hyukjun Gweon, Matthias Schonlau et Marika WenemarkNote 1

  • Date de diffusion : Le 15 décembre 2020

Résumé

Dans les enquêtes, les réponses textuelles à des questions ouvertes ont de l’importance, puisqu’elles permettent aux répondants de livrer plus de renseignements sans contrainte. Dans une classification automatique des réponses à des questions ouvertes en apprentissage supervisé, la précision souvent n’est pas assez grande. Comme autre possibilité, une stratégie de classification semi-automatisée peut être envisagée : les réponses sont classifiées automatiquement dans le groupe facile à classer et classifiées manuellement dans le reste. Nous présentons ici une méthode de classification semi-automatisée des réponses à des questions ouvertes à étiquettes multiples pour les cas où les réponses textuelles peuvent appartenir simultanément à plusieurs classes. La méthode que nous proposons se trouve à combiner de multiples chaînes de classification probabiliste en évitant des coûts de calcul prohibitifs. L’évaluation du rendement sur trois ensembles de données démontre l’efficacité de cette méthode.

Mots-clés :     Classification semi-automatisée; questions ouvertes; donnée à étiquettes multiples.

Table des matières

Citation de l'article

Gweon, H., Schonlau, M. et Wenemark, M. (2020). Classification semi-automatisée des réponses à des questions ouvertes à étiquettes multiples. Techniques d’enquête, Statistique Canada, n° 12-001-X au catalogue, vol. 46,  2. Article accessible à l'adresse https://www150.statcan.gc.ca/n1/pub/12-001-x/2020002/article/00005-fra.htm.

Note


Date de modification :