Wie Schwellenwerte die Performance beeinflussen
Einen Schwellenwert von 0.4 zu setzen, liefert vielversprechende Ergebnisse für die Modellevaluierung. Jetzt kannst du den finanziellen Einfluss mit dem Default-Recall beurteilen, den du aus dem Classification Reporting mithilfe der Funktion precision_recall_fscore_support() auswählst.
Dazu schätzt du die Höhe des unerwarteten Verlusts, indem du mit dem Default-Recall berechnest, welchen Anteil der Defaults du mit dem neuen Schwellenwert nicht erwischt hast. Das ergibt einen Dollar-Betrag, der dir sagt, wie hoch der Verlust wäre, wenn alle nicht gefundenen Defaults gleichzeitig ausfallen würden.
Der durchschnittliche Darlehensbetrag avg_loan_amnt wurde berechnet und im Workspace zusammen mit preds_df und y_test bereitgestellt.
Diese Übung ist Teil des Kurses
Kreditrisikomodellierung in Python
Anleitung zur Übung
- Weise die
loan_status-Werte mit dem Schwellenwert0.4neu zu. - Speichere die Anzahl der Defaults in
preds_df, indem du den zweiten Wert aus den Value Counts auswählst, und speichere ihn alsnum_defaults. - Hole die Default-Recall-Rate aus der Klassifikationsmatrix und speichere sie als
default_recall. - Schätze den unerwarteten Verlust basierend auf dem neuen Default-Recall, indem du
1 - default_recallmit dem durchschnittlichen Darlehensbetrag und der Anzahl der Default-Darlehen multiplizierst.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Reassign the values of loan status based on the new threshold
____[____] = ____[____].____(lambda x: 1 if x > ____ else 0)
# Store the number of loan defaults from the prediction data
____ = preds_df[____].____()[1]
# Store the default recall from the classification report
____ = ____(____,preds_df[____])[1][1]
# Calculate the estimated impact of the new default recall rate
print(____ * ____ * (1 - ____))