Aan de slagGa gratis aan de slag

Hoe drempels de prestaties beïnvloeden

De drempel instellen op 0.4 geeft veelbelovende resultaten voor de modelbeoordeling. Nu kun je de financiële impact inschatten met de recall voor defaults, die je haalt uit het classificatierapport met de functie precision_recall_fscore_support().

Hiervoor schat je het onverwachte verlies in door de default-recall te gebruiken om te bepalen welk aandeel defaults je niet hebt onderschept met de nieuwe drempel. Dit levert een bedrag in dollars op dat aangeeft hoeveel verlies je zou hebben als alle niet-gevonden defaults in één keer zouden uitvallen.

De gemiddelde leningwaarde, avg_loan_amnt, is berekend en beschikbaar in de werkruimte, samen met preds_df en y_test.

Deze oefening maakt deel uit van de cursus

Kredietrisicomodellering in Python

Cursus bekijken

Oefeninstructies

  • Wijs de loan_status-waarden opnieuw toe met de drempel 0.4.
  • Sla het aantal defaults in preds_df op door de tweede waarde uit de value counts te selecteren en op te slaan als num_defaults.
  • Haal de default-recall uit de classificatiematrix en sla deze op als default_recall.
  • Schat het onverwachte verlies op basis van de nieuwe default-recall door 1 - default_recall te vermenigvuldigen met het gemiddelde leenbedrag en het aantal defaultleningen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Reassign the values of loan status based on the new threshold
____[____] = ____[____].____(lambda x: 1 if x > ____ else 0)

# Store the number of loan defaults from the prediction data
____ = preds_df[____].____()[1]

# Store the default recall from the classification report
____ = ____(____,preds_df[____])[1][1]

# Calculate the estimated impact of the new default recall rate
print(____ * ____ * (1 - ____))
Code bewerken en uitvoeren