Einen schön beschnittenen Baum schaffen
Wenn du einen Baum daran hinderst, ganz zu wachsen, kann das dazu führen, dass er einige Aspekte der Daten ignoriert oder wichtige Trends verpasst, die er vielleicht später entdeckt hat.
Durch das Nachschneiden kannst du einen großen und komplexen Baum absichtlich wachsen lassen und ihn später kleiner und effizienter beschneiden.
In dieser Übung hast du die Möglichkeit, eine Visualisierung der Leistung des Baums im Verhältnis zur Komplexität zu erstellen und diese Informationen zu nutzen, um den Baum auf eine geeignete Ebene zu stutzen.
Das Paket rpart
wurde zusammen mit loans_test
und loans_train
vorinstalliert.
Diese Übung ist Teil des Kurses
Überwachtes Lernen in R: Klassifikation
Anleitung zur Übung
- Verwende alle Bewerbervariablen und keine Vorbeschneidung, um einen übermäßig komplexen Baum zu erstellen. Stelle sicher, dass du
cp = 0
inrpart.control()
einstellst, um ein Vorbeschneiden zu verhindern. - Erstelle ein Komplexitätsdiagramm, indem du
plotcp()
für das Modell verwendest. - Basierend auf dem Komplexitätsdiagramm beschneide den Baum auf eine Komplexität von 0,0014, indem du die Funktion
prune()
mit dem Baum und dem Komplexitätsparameter verwendest. - Vergleiche die Genauigkeit des beschnittenen Baums mit der ursprünglichen Genauigkeit von 58,3 %. Um die Genauigkeit zu berechnen, verwende die Funktionen
predict()
undmean()
.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Grow an overly complex tree
loan_model <- ___
# Examine the complexity plot
plotcp(___)
# Prune the tree
loan_model_pruned <- ___(___, cp = ___)
# Compute the accuracy of the pruned tree
loans_test$pred <- ___
mean(___)