Einen einfachen Entscheidungsbaum erstellen
Der Datensatz loans enthält 11.312 zufällig ausgewählte Personen, die bei Lending Club, einem US-basierten Peer-to-Peer-Kreditunternehmen, einen Kredit beantragt und später erhalten haben.
Du verwendest einen Entscheidungsbaum, um Muster im Ausgang dieser Kredite (entweder zurückgezahlt oder ausgefallen) auf Basis der beantragten Kreditsumme und der Bonität zum Zeitpunkt der Antragstellung zu lernen.
Anschließend schaust du dir an, wie sich die Vorhersagen des Baums für eine Antragstellerin bzw. einen Antragsteller mit guter Bonität im Vergleich zu schlechter Bonität unterscheiden.
Der Datensatz loans wurde für dich geladen.
Diese Übung ist Teil des Kurses
Überwachtes Lernen in R: Klassifikation
Anleitung zur Übung
- Lade das Paket
rpart. - Fitte ein Entscheidungsbaum-Modell mit der Funktion
rpart().- Übergebe als erstes Argument die R-Formel, die
outcomeals Funktion vonloan_amountundcredit_scoreangibt. - Lass das Argument
controlvorerst unverändert. (Mehr dazu später!)
- Übergebe als erstes Argument die R-Formel, die
- Verwende
predict()mit dem resultierenden Kreditmodell, um das Ergebnis für die Bewerberin bzw. den Bewerbergood_creditvorherzusagen. Nutze das Argumenttype, um die"class"des Outcomes vorherzusagen. - Mach dasselbe für
bad_credit.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Load the rpart package
# Build a lending model predicting loan outcome versus loan amount and credit score
loan_model <- rpart(___, data = ___, method = "___", control = rpart.control(cp = 0))
# Make a prediction for someone with good credit
predict(___, ___, type = "___")
# Make a prediction for someone with bad credit