Hoe drempels de prestaties beïnvloeden
De drempel instellen op 0.4 geeft veelbelovende resultaten voor de modelbeoordeling. Nu kun je de financiële impact inschatten met de recall voor defaults, die je haalt uit het classificatierapport met de functie precision_recall_fscore_support().
Hiervoor schat je het onverwachte verlies in door de default-recall te gebruiken om te bepalen welk aandeel defaults je niet hebt onderschept met de nieuwe drempel. Dit levert een bedrag in dollars op dat aangeeft hoeveel verlies je zou hebben als alle niet-gevonden defaults in één keer zouden uitvallen.
De gemiddelde leningwaarde, avg_loan_amnt, is berekend en beschikbaar in de werkruimte, samen met preds_df en y_test.
Deze oefening maakt deel uit van de cursus
Kredietrisicomodellering in Python
Oefeninstructies
- Wijs de
loan_status-waarden opnieuw toe met de drempel0.4. - Sla het aantal defaults in
preds_dfop door de tweede waarde uit de value counts te selecteren en op te slaan alsnum_defaults. - Haal de default-recall uit de classificatiematrix en sla deze op als
default_recall. - Schat het onverwachte verlies op basis van de nieuwe default-recall door
1 - default_recallte vermenigvuldigen met het gemiddelde leenbedrag en het aantal defaultleningen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Reassign the values of loan status based on the new threshold
____[____] = ____[____].____(lambda x: 1 if x > ____ else 0)
# Store the number of loan defaults from the prediction data
____ = preds_df[____].____()[1]
# Store the default recall from the classification report
____ = ____(____,preds_df[____])[1][1]
# Calculate the estimated impact of the new default recall rate
print(____ * ____ * (1 - ____))