Techniques d’enquête
Classification semi-automatisée des réponses à des questions ouvertes à étiquettes multiples
par Hyukjun Gweon, Matthias Schonlau et Marika WenemarkNote 1
- Date de diffusion : Le 15 décembre 2020
Résumé
Dans les enquêtes, les réponses textuelles à des questions ouvertes ont de l’importance, puisqu’elles permettent aux répondants de livrer plus de renseignements sans contrainte. Dans une classification automatique des réponses à des questions ouvertes en apprentissage supervisé, la précision souvent n’est pas assez grande. Comme autre possibilité, une stratégie de classification semi-automatisée peut être envisagée : les réponses sont classifiées automatiquement dans le groupe facile à classer et classifiées manuellement dans le reste. Nous présentons ici une méthode de classification semi-automatisée des réponses à des questions ouvertes à étiquettes multiples pour les cas où les réponses textuelles peuvent appartenir simultanément à plusieurs classes. La méthode que nous proposons se trouve à combiner de multiples chaînes de classification probabiliste en évitant des coûts de calcul prohibitifs. L’évaluation du rendement sur trois ensembles de données démontre l’efficacité de cette méthode.
Mots-clés : Classification semi-automatisée; questions ouvertes; donnée à étiquettes multiples.
Table des matières
- Section 1. Introduction
- Section 2. Classification semi-automatisée de données textuelles
- Section 3. Classification à étiquettes multiples
- Section 4. Ensemble de chaînes de classification probabiliste à vote majoritaire en classification semi-automatisée
- Section 5. Expériences
- Section 6. Analyse
- Bibliographie
Citation de l'article
Gweon, H., Schonlau, M. et Wenemark, M. (2020). Classification semi-automatisée des réponses à des questions ouvertes à étiquettes multiples. Techniques d’enquête, Statistique Canada, n° 12-001-X au catalogue, vol. 46, n° 2. Article accessible à l'adresse https://www150.statcan.gc.ca/n1/pub/12-001-x/2020002/article/00005-fra.htm.
Note
- Date de modification :