Bericht zur Klassifikation von Defaults
Es ist Zeit, die Modellbewertung genauer anzuschauen. Hier hilft dir das Setzen des Schwellenwerts für die Ausfallwahrscheinlichkeit, die Modellleistung über einen Klassifikationsbericht zu analysieren.
Einen DataFrame mit den Wahrscheinlichkeiten zu erstellen, macht die Arbeit damit einfacher, weil du die ganze Power von pandas nutzen kannst. Wende den Schwellenwert auf die Daten an und prüfe die Value Counts für beide Klassen von loan_status, um zu sehen, wie viele Vorhersagen jeweils entstehen. Das liefert dir Kontext für die Werte im Klassifikationsbericht.
Der Datensatz cr_loan_prep, die trainierte logistische Regression clf_logistic, die echten Kreditstatuswerte y_test und die vorhergesagten Wahrscheinlichkeiten preds sind im Workspace geladen.
Diese Übung ist Teil des Kurses
Kreditrisikomodellierung in Python
Anleitung zur Übung
- Erstelle einen DataFrame nur mit den Ausfallwahrscheinlichkeiten aus
predsund nenne ihnpreds_df. - Weise
loan_statusbasierend auf einem Schwellenwert von0,50für die Ausfallwahrscheinlichkeit inpreds_dfneu zu. - Gib die Value Counts der Zeilenanzahl für jeden
loan_statusaus. - Gib den Klassifikationsbericht mit
y_testundpreds_dfaus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a dataframe for the probabilities of default
____ = pd.____(____[:,1], columns = ['prob_default'])
# Reassign loan status based on the threshold
____[____] = ____[____].apply(lambda x: 1 if x > ____ else 0)
# Print the row counts for each loan status
print(____[____].____())
# Print the classification report
target_names = ['Non-Default', 'Default']
print(____(____, ____['loan_status'], target_names=target_names))