Erste SchritteKostenlos loslegen

Einen größeren Baum bauen und bewerten

Zuvor hast du einen einfachen Entscheidungsbaum erstellt, der die Kreditwürdigkeit des Antragstellers und den beantragten Kreditbetrag zur Vorhersage des Kreditergebnisses verwendet.

Lending Club verfügt über zusätzliche Informationen über die Antragsteller, wie z. B. den Status des Wohneigentums, die Dauer der Beschäftigung, den Verwendungszweck des Kredits und frühere Insolvenzen, die für eine genauere Vorhersage nützlich sein können.

Erstelle mit allen verfügbaren Bewerberdaten ein anspruchsvolleres Kreditvergabemodell, indem du den zuvor erstellten zufälligen Trainingsdatensatz verwendest. Anschließend verwendest du dieses Modell, um Vorhersagen für den Testdatensatz zu treffen, um die Leistung des Modells bei zukünftigen Kreditanträgen zu schätzen.

Das Paket rpart wurde vorgeladen und die Datensätze loans_train und loans_test wurden erstellt.

Diese Übung ist Teil des Kurses

Überwachtes Lernen in R: Klassifikation

Kurs anzeigen

Anleitung zur Übung

  • Verwende rpart(), um ein Kreditmodell mit dem Trainingsdatensatz und allen verfügbaren Prädiktoren zu erstellen. Auch hier gilt: Lass das control Argument in Ruhe.
  • Wende die Funktion predict() auf den Testdatensatz an und erstelle einen Vektor der vorhergesagten Ergebnisse. Vergiss nicht das type Argument.
  • Erstelle eine table(), um die vorhergesagten Werte mit den tatsächlichen outcome Werten zu vergleichen.
  • Berechne die Genauigkeit der Vorhersagen mit der Funktion mean().

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Grow a tree using all of the available applicant data
loan_model <- rpart(___, data = ___, method = "___", control = rpart.control(cp = 0))

# Make predictions on the test dataset
loans_test$pred <- ___

# Examine the confusion matrix
table(___, ___)

# Compute the accuracy on the test dataset
mean(___)
Bearbeiten und Ausführen von Code