Prédire les transitions vers la pauvreté et hors de celle-ci, à l’aide de l’apprentissage automatique - ARCHIVÉ
Articles et rapports : 11-522-X202100100003
La taille et la richesse croissantes des données numériques permettent de modéliser des relations et des interactions plus complexes, ce qui est le point fort de l’apprentissage automatique. Dans notre étude, nous avons appliqué le boosting de gradient au système néerlandais d’ensembles de données statistiques sociales pour estimer les probabilités de transition vers la pauvreté et de sortie de la pauvreté. Les estimations individuelles sont raisonnables, mais la méthode combinée avec SHAP et des modèles de substitution globaux apporte des avantages, principalement : le classement simultané de centaines de caractéristiques selon leur importance, une vue détaillée de leur relation avec les probabilités de transition, et l’identification fondée sur les données de sous-populations ayant des probabilités de transition relativement élevées et faibles. En outre, nous décomposons la différence de l’importance des caractéristiques entre la population générale et les sous-populations entre un effet de fréquence et un effet de la caractéristique. Nous mettons en garde contre les possibilités de mauvaise interprétation et discutons des futurs travaux envisageables.
Mots clés : classification; explicabilité; boosting de gradient; événement de la vie; facteurs de risque; décomposition SHAP.
Produit principal : La série des symposiums internationaux de Statistique Canada : recueil
Format | Date de sortie | Informations supplémentaires |
---|---|---|
15 octobre 2021 |
Information connexe
Sujets et mots-clés
Sujets
Mots-clés
- Date de modification :