Prevedere la probabilità di default
Nel video hai osservato la probabilità prevista di default per un caso nel test set. Per fortuna, puoi prevedere la probabilità per tutti i casi del test set in una volta usando la funzione predict().
Dopo aver ottenuto tutte le previsioni per gli elementi del test set, è utile farsi un'idea iniziale di quanto il modello sappia discriminare guardando l'intervallo delle probabilità previste. Un intervallo ridotto significa che le previsioni per i casi del test set non sono molto distanti tra loro e quindi il modello potrebbe non essere molto efficace nel distinguere buoni e cattivi clienti. Con percentuali di default basse, noterai che in generale vengono previste probabilità di default molto basse. È il momento di dare un primo sguardo al modello.
log_model_small è caricato nello spazio di lavoro.
Questo esercizio fa parte del corso
Credit Risk Modeling in R
Istruzioni dell'esercizio
- Il codice per la previsione di
test_casemostrato nel video è stato copiato nel tuo spazio di lavoro. Modifica il codice in modo che la funzionepredict()venga applicata a tutti i casi intest_set. Puoi salvarli nell'oggettopredictions_all_small. - Fatti un'idea iniziale di quanto il modello sappia discriminare usando
range()
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Make PD-predictions for all the test set elements using the "log_model_small" logistic regression model
predictions_all_small <- predict(log_model_small, newdata = test_case, type = "response")
# Look at the range of the object "predictions_all_small"