Einen schön beschnittenen Baum erstellen
Einen Baum vorzeitig am Weiterwachsen zu hindern, kann dazu führen, dass er bestimmte Aspekte der Daten ignoriert oder wichtige Muster verpasst, die er später entdeckt hätte.
Mit Post-Pruning kannst du absichtlich einen großen und komplexen Baum wachsen lassen und ihn anschließend kleiner und effizienter beschneiden.
In dieser Übung kannst du eine Visualisierung der Leistung des Baums in Abhängigkeit von seiner Komplexität erstellen und diese Information nutzen, um den Baum auf ein geeignetes Maß zu beschneiden.
Das Paket rpart ist bereits geladen, ebenso loans_test und loans_train.
Diese Übung ist Teil des Kurses
Überwachtes Lernen in R: Klassifikation
Anleitung zur Übung
- Verwende alle Bewerber-Variablen und kein Pre-Pruning, um einen übermäßig komplexen Baum zu erstellen. Setze dazu
cp = 0inrpart.control(), um Pre-Pruning zu verhindern. - Erstelle ein Komplexitätsdiagramm, indem du
plotcp()auf das Modell anwendest. - Beschneide den Baum auf eine Komplexität von 0.0014, basierend auf dem Komplexitätsdiagramm, mit der Funktion
prune()unter Angabe des Baums und des Komplexitätsparameters. - Vergleiche die Genauigkeit des beschnittenen Baums mit der ursprünglichen Genauigkeit von 58.3 %. Um die Genauigkeit zu berechnen, verwende die Funktionen
predict()undmean().
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Grow an overly complex tree
loan_model <- ___
# Examine the complexity plot
plotcp(___)
# Prune the tree
loan_model_pruned <- ___(___, cp = ___)
# Compute the accuracy of the pruned tree
loans_test$pred <- ___
mean(___)