Te grote bomen voorkomen
De boom die is gegroeid op de volledige set met aanvragers werd extreem groot en complex, met honderden splitsingen en bladknopen met maar een handvol aanvragers. Zo’n boom is voor een kredietmedewerker bijna niet te interpreteren.
Met pre-pruning (vroegtijdig stoppen) kun je voorkomen dat een boom te groot en te complex wordt. Bekijk hoe de rpart-instellingen voor maximale boomdiepte en minimaal aantal observaties om te splitsen invloed hebben op de resulterende boom.
De gegevenssets loans_train en loans_test zijn aangemaakt en rpart is vooraf geladen.
Deze oefening maakt deel uit van de cursus
Supervised Learning in R: Classificatie
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Grow a tree with maxdepth of 6
loan_model <- ___
# Make a class prediction on the test set
loans_test$pred <- ___
# Compute the accuracy of the simpler tree
mean(___)