Tornando os modelos mais discriminativos
No exercício anterior, a faixa das probabilidades previstas de inadimplência estava bem estreita. Como discutido, probabilidades previstas pequenas são esperadas quando a taxa de inadimplência é baixa, mas construir modelos maiores (o que basicamente significa: incluir mais preditores) pode ampliar a faixa das suas predições.
Se isso vai levar a predições melhores ainda precisa ser validado e depende da qualidade dos novos preditores incluídos. Mas, antes, confira como modelos maiores podem ampliar essa faixa.
Este exercício faz parte do curso
Modelagem de Risco de Crédito em R
Instruções do exercício
- Crie
log_model_fullda mesma forma que você crioulog_model_small, mas agora inclua todos os preditores disponíveis no conjunto de dados. Se você não quiser digitar o nome de cada coluna separadamente, pode simplesmente selecionar todas as variáveis usandoloan_status ~ . - Crie seu vetor de predições
predictions_all_fullpara todos os casos no conjunto de teste usandopredict(). Observe que esses valores representam a probabilidade de inadimplência. - Observe a faixa das predições.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Change the code below to construct a logistic regression model using all available predictors in the data set
log_model_small <- glm(loan_status ~ age + ir_cat, family = "binomial", data = training_set)
# Make PD-predictions for all test set elements using the the full logistic regression model
# Look at the predictions range