Überwachsene Bäume verhindern
Der auf dem vollständigen Bewerberdatensatz gewachsene Baum wurde extrem groß und komplex – mit Hunderten von Splits und Blattknoten, in denen jeweils nur eine Handvoll Bewerber:innen landeten. Für eine Kreditsachbearbeiterin oder einen -sachbearbeiter wäre dieser Baum kaum zu interpretieren.
Mit Pre-Pruning-Methoden für frühzeitiges Stoppen kannst du verhindern, dass ein Baum zu groß und zu komplex wird. Sieh dir an, wie sich die rpart-Steuerungsoptionen für maximale Baumtiefe und minimale Split-Anzahl auf den resultierenden Baum auswirken.
Die Datensätze loans_train und loans_test wurden erstellt, und rpart ist vorab geladen.
Diese Übung ist Teil des Kurses
Überwachtes Lernen in R: Klassifikation
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Grow a tree with maxdepth of 6
loan_model <- ___
# Make a class prediction on the test set
loans_test$pred <- ___
# Compute the accuracy of the simpler tree
mean(___)