Créer un arbre bien taillé
Arrêter la croissance d'un arbre peut l'amener à ignorer certains aspects des données ou à passer à côté de tendances importantes qu'il aurait pu découvrir plus tard.
En utilisant la post-taille, vous pouvez intentionnellement faire pousser un arbre grand et complexe, puis le tailler pour qu'il soit plus petit et plus efficace par la suite.
Dans cet exercice, vous aurez l'occasion de visualiser les performances de l'arbre en fonction de sa complexité et d'utiliser ces informations pour élaguer l'arbre à un niveau approprié.
Le paquet rpart
a été préchargé, ainsi que loans_test
et loans_train
.
Cet exercice fait partie du cours
Apprentissage supervisé en R : Classification
Instructions
- Utilisez toutes les variables du demandeur et ne procédez à aucun élagage préalable pour créer un arbre trop complexe. Veillez à placer
cp = 0
surrpart.control()
afin d'éviter la taille préalable. - Créez un diagramme de complexité en utilisant
plotcp()
sur le modèle. - Sur la base du diagramme de complexité, élaguez l'arbre jusqu'à une complexité de 0,0014 en utilisant la fonction
prune()
avec l'arbre et le paramètre de complexité. - Comparez la précision de l'arbre élagué à la précision initiale de 58,3 %. Pour calculer la précision, utilisez les fonctions
predict()
etmean()
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Grow an overly complex tree
loan_model <- ___
# Examine the complexity plot
plotcp(___)
# Prune the tree
loan_model_pruned <- ___(___, cp = ___)
# Compute the accuracy of the pruned tree
loans_test$pred <- ___
mean(___)