Einen größeren Baum bauen und bewerten
Zuvor hast du einen einfachen Entscheidungsbaum erstellt, der die Kreditwürdigkeit des Antragstellers und den beantragten Kreditbetrag zur Vorhersage des Kreditergebnisses verwendet.
Lending Club verfügt über zusätzliche Informationen über die Antragsteller, wie z. B. den Status des Wohneigentums, die Dauer der Beschäftigung, den Verwendungszweck des Kredits und frühere Insolvenzen, die für eine genauere Vorhersage nützlich sein können.
Erstelle mit allen verfügbaren Bewerberdaten ein anspruchsvolleres Kreditvergabemodell, indem du den zuvor erstellten zufälligen Trainingsdatensatz verwendest. Anschließend verwendest du dieses Modell, um Vorhersagen für den Testdatensatz zu treffen, um die Leistung des Modells bei zukünftigen Kreditanträgen zu schätzen.
Das Paket rpart
wurde vorgeladen und die Datensätze loans_train
und loans_test
wurden erstellt.
Diese Übung ist Teil des Kurses
Überwachtes Lernen in R: Klassifikation
Anleitung zur Übung
- Verwende
rpart()
, um ein Kreditmodell mit dem Trainingsdatensatz und allen verfügbaren Prädiktoren zu erstellen. Auch hier gilt: Lass dascontrol
Argument in Ruhe. - Wende die Funktion
predict()
auf den Testdatensatz an und erstelle einen Vektor der vorhergesagten Ergebnisse. Vergiss nicht dastype
Argument. - Erstelle eine
table()
, um die vorhergesagten Werte mit den tatsächlichenoutcome
Werten zu vergleichen. - Berechne die Genauigkeit der Vorhersagen mit der Funktion
mean()
.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Grow a tree using all of the available applicant data
loan_model <- rpart(___, data = ___, method = "___", control = rpart.control(cp = 0))
# Make predictions on the test dataset
loans_test$pred <- ___
# Examine the confusion matrix
table(___, ___)
# Compute the accuracy on the test dataset
mean(___)