LoslegenKostenlos loslegen

Einen schön beschnittenen Baum erstellen

Einen Baum vorzeitig am Weiterwachsen zu hindern, kann dazu führen, dass er bestimmte Aspekte der Daten ignoriert oder wichtige Muster verpasst, die er später entdeckt hätte.

Mit Post-Pruning kannst du absichtlich einen großen und komplexen Baum wachsen lassen und ihn anschließend kleiner und effizienter beschneiden.

In dieser Übung kannst du eine Visualisierung der Leistung des Baums in Abhängigkeit von seiner Komplexität erstellen und diese Information nutzen, um den Baum auf ein geeignetes Maß zu beschneiden.

Das Paket rpart ist bereits geladen, ebenso loans_test und loans_train.

Diese Übung ist Teil des Kurses

Überwachtes Lernen in R: Klassifikation

Kurs anzeigen

Anleitung zur Übung

  • Verwende alle Bewerber-Variablen und kein Pre-Pruning, um einen übermäßig komplexen Baum zu erstellen. Setze dazu cp = 0 in rpart.control(), um Pre-Pruning zu verhindern.
  • Erstelle ein Komplexitätsdiagramm, indem du plotcp() auf das Modell anwendest.
  • Beschneide den Baum auf eine Komplexität von 0.0014, basierend auf dem Komplexitätsdiagramm, mit der Funktion prune() unter Angabe des Baums und des Komplexitätsparameters.
  • Vergleiche die Genauigkeit des beschnittenen Baums mit der ursprünglichen Genauigkeit von 58.3 %. Um die Genauigkeit zu berechnen, verwende die Funktionen predict() und mean().

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Grow an overly complex tree
loan_model <- ___

# Examine the complexity plot
plotcp(___)

# Prune the tree
loan_model_pruned <- ___(___, cp = ___)

# Compute the accuracy of the pruned tree
loans_test$pred <- ___
mean(___)
Code bearbeiten und ausführen