Incluindo uma matriz de perdas
Por fim, você pode incluir uma matriz de perdas, alterando a importância relativa de classificar erroneamente um default como non-default versus um non-default como default. Você quer enfatizar que classificar um default como non-default deve ser penalizado mais severamente. Incluir uma matriz de perdas pode novamente ser feito no argumento parms na matriz de perdas.
parms = list(loss = matrix(c(0, cost_def_as_nondef, cost_nondef_as_def, 0), ncol=2))
Ao fazer isso, você está construindo uma matriz 2x2 com zeros na diagonal e penalidades de perda alteradas fora da diagonal. A matriz de perdas padrão tem todos os valores iguais a um fora da diagonal.
Este exercício faz parte do curso
Modelagem de Risco de Crédito em R
Instruções do exercício
- Altere o código fornecido para incluir essa matriz de perdas, com uma penalização 10 vezes maior ao classificar erroneamente um default real como non-default. Isso pode ser feito substituindo
cost_def_as_nondefpor 10 ecost_nondef_as_defpor 1. Assim como nos exercícios anteriores, incluarpart.controlpara relaxar o parâmetro de complexidade para 0.001. - Plote a árvore de decisão usando a função plot e o nome do objeto da árvore. Adicione um segundo argumento
uniform = TRUEpara obter ramos de tamanho igual e adicione rótulos à árvore usandotext()com o nome do objeto da árvore.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Change the code below such that a decision tree is constructed using a loss matrix penalizing 10 times more heavily for misclassified defaults.
tree_loss_matrix <- rpart(loan_status ~ ., method = "class",
data = training_set)
# Plot the decision tree
# Add labels to the decision tree