Especificando um cut-off
Mostramos como a especificação de um cut-off pode fazer a diferença para obter uma boa matriz de confusão. Agora, você vai aprender a transformar o vetor de previsões em um vetor de valores binários que indicam o status do empréstimo. A função ifelse(), do R, pode ajudar aqui.
Aplicando a função ifelse() no contexto de um cut-off, você teria algo como
ifelse(predictions > 0.3, 1, 0)
No primeiro argumento, você testa se um certo valor no vetor de previsões é maior que 0.3. Se isso for TRUE, o R retorna "1" (especificado no segundo argumento); se for FALSE, o R retorna "0" (especificado no terceiro argumento), representando "default" e "sem default", respectivamente.
Este exercício faz parte do curso
Modelagem de Risco de Crédito em R
Instruções do exercício
- O código para o modelo completo de regressão logística, junto com o vetor de previsões, está disponível no seu console.
- Usando um cutoff de 0,15, crie o vetor
pred_cutoff_15usando a funçãoifelse()epredictions_all_full. - Veja a matriz de confusão usando
table()(insira os valores verdadeiros, ou seja,test_set$loan_status, no primeiro argumento).
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# The code for the logistic regression model and the predictions is given below
log_model_full <- glm(loan_status ~ ., family = "binomial", data = training_set)
predictions_all_full <- predict(log_model_full, newdata = test_set, type = "response")
# Make a binary predictions-vector using a cut-off of 15%
# Construct a confusion matrix