Costruire modelli più discriminanti
Nell'esercizio precedente, l'intervallo delle probabilità previste di default era piuttosto ridotto. Come discusso, probabilità di default basse sono attese quando i tassi di default sono bassi, ma costruire modelli più grandi (che in pratica significa: includere più predittori) può ampliare l'intervallo delle tue previsioni.
Se questo porterà davvero a previsioni migliori va ancora validato e dipende dalla qualità dei nuovi predittori inclusi. Per prima cosa, però, osserva come modelli più grandi possano ampliare l'intervallo.
Questo esercizio fa parte del corso
Credit Risk Modeling in R
Istruzioni dell'esercizio
- Crea
log_model_fullnello stesso modo in cui hai creatolog_model_small, ma questa volta includi tutti i predittori disponibili nell'insieme di dati. Se non vuoi digitare il nome di ogni colonna separatamente, puoi selezionare tutte le variabili conloan_status ~ . - Crea il vettore di predizioni
predictions_all_fullper tutti i casi nel test set usandopredict(). Nota che questi valori rappresentano la probabilità di andare in default. - Osserva l'intervallo delle predizioni.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Change the code below to construct a logistic regression model using all available predictors in the data set
log_model_small <- glm(loan_status ~ age + ir_cat, family = "binomial", data = training_set)
# Make PD-predictions for all test set elements using the the full logistic regression model
# Look at the predictions range