Prevendo a probabilidade de inadimplência
No vídeo, você analisou a probabilidade prevista de inadimplência para um caso do conjunto de teste. Felizmente, você pode prever a probabilidade para todos os casos do conjunto de teste de uma vez usando a função predict().
Depois de obter todas as previsões para os elementos do conjunto de teste, é útil ter uma ideia inicial de quão bom o modelo é na discriminação observando o intervalo das probabilidades previstas. Um intervalo pequeno significa que as previsões para os casos do conjunto de teste não estão muito distantes entre si e, portanto, o modelo pode não ser muito bom em discriminar bons e maus clientes. Com porcentagens baixas de inadimplência, você vai notar que, em geral, são previstas probabilidades de inadimplência muito baixas. Hora de dar uma olhada no primeiro modelo.
log_model_small está carregado no workspace.
Este exercício faz parte do curso
Modelagem de Risco de Crédito em R
Instruções do exercício
- O código da previsão de
test_casemostrado no vídeo foi copiado para o seu workspace. Altere o código para que a funçãopredict()seja aplicada a todos os casos emtest_set. Você pode armazená-los no objetopredictions_all_small. - Tenha uma ideia inicial de quão bem o modelo consegue discriminar usando
range()
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Make PD-predictions for all the test set elements using the "log_model_small" logistic regression model
predictions_all_small <- predict(log_model_small, newdata = test_case, type = "response")
# Look at the range of the object "predictions_all_small"