Een eenvoudige beslisboom bouwen
De loans-gegevensset bevat 11.312 willekeurig geselecteerde mensen die een lening hebben aangevraagd en later hebben gekregen via Lending Club, een Amerikaans peer-to-peer-leenplatform.
Je gaat een beslisboom gebruiken om patronen te leren in de uitkomst van deze leningen (ofwel terugbetaald of wanbetaling), op basis van het aangevraagde leenbedrag en de kredietscore ten tijde van de aanvraag.
Kijk daarna hoe de voorspellingen van de boom verschillen voor een aanvrager met een goede kredietscore versus iemand met een slechte kredietscore.
De gegevensset loans is al voor je geladen.
Deze oefening maakt deel uit van de cursus
Supervised Learning in R: Classificatie
Oefeninstructies
- Laad het
rpart-pakket. - Fit een beslisboommodel met de functie
rpart().- Geef als eerste argument de R-formule op waarin
outcomewordt gespecificeerd als een functie vanloan_amountencredit_score. - Laat het argument
controlvoorlopig met rust. (Daar leer je later meer over!)
- Geef als eerste argument de R-formule op waarin
- Gebruik
predict()met het resulterende leningmodel om de uitkomst voor de aanvragergood_creditte voorspellen. Gebruik het argumenttypeom de"class"van de uitkomst te voorspellen. - Doe hetzelfde voor de aanvrager
bad_credit.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load the rpart package
# Build a lending model predicting loan outcome versus loan amount and credit score
loan_model <- rpart(___, data = ___, method = "___", control = rpart.control(cp = 0))
# Make a prediction for someone with good credit
predict(___, ___, type = "___")
# Make a prediction for someone with bad credit