ComeçarComece de graça

Tornando os modelos mais discriminativos

No exercício anterior, a faixa das probabilidades previstas de inadimplência estava bem estreita. Como discutido, probabilidades previstas pequenas são esperadas quando a taxa de inadimplência é baixa, mas construir modelos maiores (o que basicamente significa: incluir mais preditores) pode ampliar a faixa das suas predições.

Se isso vai levar a predições melhores ainda precisa ser validado e depende da qualidade dos novos preditores incluídos. Mas, antes, confira como modelos maiores podem ampliar essa faixa.

Este exercício faz parte do curso

Modelagem de Risco de Crédito em R

Ver curso

Instruções do exercício

  • Crie log_model_full da mesma forma que você criou log_model_small, mas agora inclua todos os preditores disponíveis no conjunto de dados. Se você não quiser digitar o nome de cada coluna separadamente, pode simplesmente selecionar todas as variáveis usando loan_status ~ .
  • Crie seu vetor de predições predictions_all_full para todos os casos no conjunto de teste usando predict(). Observe que esses valores representam a probabilidade de inadimplência.
  • Observe a faixa das predições.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Change the code below to construct a logistic regression model using all available predictors in the data set
log_model_small <- glm(loan_status ~ age + ir_cat, family = "binomial", data = training_set)

# Make PD-predictions for all test set elements using the the full logistic regression model


# Look at the predictions range

Editar e executar o código