Costruire modelli più discriminanti

Nell'esercizio precedente, l'intervallo delle probabilità previste di default era piuttosto ridotto. Come discusso, probabilità di default basse sono attese quando i tassi di default sono bassi, ma costruire modelli più grandi (che in pratica significa: includere più predittori) può ampliare l'intervallo delle tue previsioni.

Se questo porterà davvero a previsioni migliori va ancora validato e dipende dalla qualità dei nuovi predittori inclusi. Per prima cosa, però, osserva come modelli più grandi possano ampliare l'intervallo.

Questo esercizio fa parte del corso

Credit Risk Modeling in R

Visualizza corso

Istruzioni dell'esercizio

Crea log_model_full nello stesso modo in cui hai creato log_model_small, ma questa volta includi tutti i predittori disponibili nell'insieme di dati. Se non vuoi digitare il nome di ogni colonna separatamente, puoi selezionare tutte le variabili con loan_status ~ .
Crea il vettore di predizioni predictions_all_full per tutti i casi nel test set usando predict(). Nota che questi valori rappresentano la probabilità di andare in default.
Osserva l'intervallo delle predizioni.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Change the code below to construct a logistic regression model using all available predictors in the data set
log_model_small <- glm(loan_status ~ age + ir_cat, family = "binomial", data = training_set)

# Make PD-predictions for all test set elements using the the full logistic regression model


# Look at the predictions range

Modifica ed esegui il codice