Construire un arbre de décision simple
L'ensemble de données loans
contient 11 312 personnes sélectionnées au hasard qui ont demandé puis obtenu un prêt auprès de Lending Club, une société de prêt de pair à pair basée sur le site US.
Vous utiliserez un arbre de décision pour tenter de dégager des tendances dans l'issue de ces prêts (remboursement ou défaut de paiement) en fonction du montant du prêt demandé et de la cote de crédit au moment de la demande.
Ensuite, voyez comment les prédictions de l'arbre diffèrent pour un candidat ayant un bon crédit et pour un candidat ayant un mauvais crédit.
L'ensemble de données loans
a été chargé pour vous.
Cet exercice fait partie du cours
Apprentissage supervisé en R : Classification
Instructions
Chargez le paquet
rpart
.Ajustez un modèle d'arbre de décision avec la fonction
rpart()
.Fournissez la formule R qui spécifie
outcome
en tant que fonction deloan_amount
etcredit_score
comme premier argument.Laissez de côté l'argument
control
pour l'instant. (Vous en saurez plus plus tard !)
Utilisez
predict()
avec le modèle de prêt résultant pour prédire le résultat pour le demandeurgood_credit
. Utilisez l'argumenttype
pour prédire le résultat"class"
.Faites de même pour le candidat
bad_credit
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load the rpart package
# Build a lending model predicting loan outcome versus loan amount and credit score
loan_model <- rpart(___, data = ___, method = "___", control = rpart.control(cp = 0))
# Make a prediction for someone with good credit
predict(___, ___, type = "___")
# Make a prediction for someone with bad credit