De prior-kansen aanpassen
Zoals in de video is uitgelegd, kun je ook de prior-kansen aanpassen om een beslisboom te verkrijgen. Dit is een indirecte manier om het belang van misklassificaties per klasse te sturen. Je kunt een extra argument meegeven aan rpart() om prior-kansen op te nemen. Het argument dat je zoekt heeft de volgende vorm
parms = list(prior=c(non_default_proportion, default_proportion))
Het pakket rpart is al geladen in je werkruimte.
Deze oefening maakt deel uit van de cursus
Kredietrisicomodellering in R
Oefeninstructies
- Pas de gegeven code aan zodat er een beslisboom wordt geconstrueerd met het argument
parms, waarbij het aandeel non-defaults 0.7 is en defaults 0.3 (ze moeten altijd optellen tot 1). Voeg daarnaast ookcontrol = rpart.control(cp = 0.001)toe. - Plot de beslisboom met de functie plot en de naam van het boomobject. Voeg een tweede argument "uniform=TRUE" toe om even grote takken te krijgen.
- Voeg labels toe aan de boom met de functie
text()en de naam van het beslisboomobject.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Change the code below such that a tree is constructed with adjusted prior probabilities.
tree_prior <- rpart(loan_status ~ ., method = "class",
data = training_set)
# Plot the decision tree
# Add labels to the decision tree