Einen einfachen Entscheidungsbaum erstellen
Der Datensatz loans enthält 11.312 zufällig ausgewählte Personen, die bei Lending Club, einem US-basierten Peer-to-Peer-Kreditunternehmen, einen Kredit beantragt und später erhalten haben.
Du verwendest einen Entscheidungsbaum, um Muster im Ausgang dieser Kredite (entweder zurückgezahlt oder ausgefallen) anhand der beantragten Kreditsumme und der Kreditwürdigkeit zum Zeitpunkt der Antragstellung zu lernen.
Anschließend siehst du, wie sich die Vorhersagen des Baums für eine Bewerberin oder einen Bewerber mit guter Bonität im Vergleich zu einer Person mit schlechter Bonität unterscheiden.
Die Datensätze loans, good_credit und bad_credit wurden für dich geladen.
Diese Übung ist Teil des Kurses
Überwachtes Lernen in R: Klassifikation
Anleitung zur Übung
- Lade das Paket
rpart. - Fitte ein Entscheidungsbaum-Modell mit der Funktion
rpart().- Übergebe als erstes Argument die R-Formel, die
outcomeals Funktion vonloan_amountundcredit_scoreangibt. - Lass das Argument
controlvorerst unverändert. (Dazu lernst du später mehr!)
- Übergebe als erstes Argument die R-Formel, die
- Verwende
predict()mit dem resultierenden Kreditmodell, um den Ausgang für die Bewerberin bzw. den Bewerbergood_creditvorherzusagen. Nutze das Argumenttype, um die"class"des Outcomes vorherzusagen. - Mach dasselbe für die Person
bad_credit.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Load the rpart package
# Build a lending model predicting loan outcome versus loan amount and credit score
loan_model <- rpart(___, data = ___, method = "___", control = rpart.control(cp = 0))
# Make a prediction for someone with good credit
predict(___, ___, type = "___")
# Make a prediction for someone with bad credit