Prevedere la probabilità di default

Nel video hai osservato la probabilità prevista di default per un caso nel test set. Per fortuna, puoi prevedere la probabilità per tutti i casi del test set in una volta usando la funzione predict().

Dopo aver ottenuto tutte le previsioni per gli elementi del test set, è utile farsi un'idea iniziale di quanto il modello sappia discriminare guardando l'intervallo delle probabilità previste. Un intervallo ridotto significa che le previsioni per i casi del test set non sono molto distanti tra loro e quindi il modello potrebbe non essere molto efficace nel distinguere buoni e cattivi clienti. Con percentuali di default basse, noterai che in generale vengono previste probabilità di default molto basse. È il momento di dare un primo sguardo al modello.

log_model_small è caricato nello spazio di lavoro.

Questo esercizio fa parte del corso

Credit Risk Modeling in R

Visualizza corso

Istruzioni dell'esercizio

Il codice per la previsione di test_case mostrato nel video è stato copiato nel tuo spazio di lavoro. Modifica il codice in modo che la funzione predict() venga applicata a tutti i casi in test_set. Puoi salvarli nell'oggetto predictions_all_small.
Fatti un'idea iniziale di quanto il modello sappia discriminare usando range()

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Make PD-predictions for all the test set elements using the "log_model_small" logistic regression model
predictions_all_small <- predict(log_model_small, newdata = test_case, type = "response")

# Look at the range of the object "predictions_all_small"

Modifica ed esegui il codice