Prévenir la prolifération des arbres
L'arbre développé sur l'ensemble des données relatives aux candidats est devenu extrêmement grand et extrêmement complexe, avec des centaines de divisions et des nœuds de feuilles ne contenant qu'une poignée de candidats. Cet arbre serait presque impossible à interpréter pour un agent de crédit.
En utilisant les méthodes de pré-taille pour un arrêt précoce, vous pouvez éviter qu'un arbre ne devienne trop grand et trop complexe. Voyez comment les options de contrôle rpart
pour la profondeur maximale de l'arbre et le nombre minimum de divisions ont un impact sur l'arbre résultant.
rpart
a été préchargé.
Cet exercice fait partie du cours
Apprentissage supervisé en R : Classification
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Grow a tree with maxdepth of 6
loan_model <- ___
# Make a class prediction on the test set
loans_test$pred <- ___
# Compute the accuracy of the simpler tree
mean(___)