Een eenvoudige beslisboom bouwen
De loans-gegevensset bevat 11.312 willekeurig geselecteerde mensen die een lening aanvroegen en later ontvingen via Lending Club, een Amerikaans peer-to-peer-leningplatform.
Je gebruikt een beslisboom om patronen te leren in de uitkomst van deze leningen (ofwel terugbetaald of wanbetaling) op basis van het aangevraagde leenbedrag en de kredietscore op het moment van aanvraag.
Bekijk daarna hoe de voorspellingen van de boom verschillen voor een aanvrager met een goede kredietwaardigheid versus een met een slechte kredietwaardigheid.
De gegevenssets loans, good_credit en bad_credit zijn voor je geladen.
Deze oefening maakt deel uit van de cursus
Supervised Learning in R: Classificatie
Oefeninstructies
- Laad het
rpart-pakket. - Fit een beslisboommodel met de functie
rpart().- Geef als eerste argument de R-formule op die
outcomespecificeert als een functie vanloan_amountencredit_score. - Laat het argument
controlvoorlopig met rust. (Daar leer je later meer over!)
- Geef als eerste argument de R-formule op die
- Gebruik
predict()met het resulterende leningenmodel om de uitkomst voor degood_credit-aanvrager te voorspellen. Gebruik het argumenttypeom de"class"van de uitkomst te voorspellen. - Doe hetzelfde voor de
bad_credit-aanvrager.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load the rpart package
# Build a lending model predicting loan outcome versus loan amount and credit score
loan_model <- rpart(___, data = ___, method = "___", control = rpart.control(cp = 0))
# Make a prediction for someone with good credit
predict(___, ___, type = "___")
# Make a prediction for someone with bad credit