Bericht zur Klassifikation von Defaults

Es ist Zeit, die Modellbewertung genauer anzuschauen. Hier hilft dir das Setzen des Schwellenwerts für die Ausfallwahrscheinlichkeit, die Modellleistung über einen Klassifikationsbericht zu analysieren.

Einen DataFrame mit den Wahrscheinlichkeiten zu erstellen, macht die Arbeit damit einfacher, weil du die ganze Power von pandas nutzen kannst. Wende den Schwellenwert auf die Daten an und prüfe die Value Counts für beide Klassen von loan_status, um zu sehen, wie viele Vorhersagen jeweils entstehen. Das liefert dir Kontext für die Werte im Klassifikationsbericht.

Der Datensatz cr_loan_prep, die trainierte logistische Regression clf_logistic, die echten Kreditstatuswerte y_test und die vorhergesagten Wahrscheinlichkeiten preds sind im Workspace geladen.

Diese Übung ist Teil des Kurses

Kreditrisikomodellierung in Python

Kurs anzeigen

Anleitung zur Übung

Erstelle einen DataFrame nur mit den Ausfallwahrscheinlichkeiten aus preds und nenne ihn preds_df.
Weise loan_status basierend auf einem Schwellenwert von 0,50 für die Ausfallwahrscheinlichkeit in preds_df neu zu.
Gib die Value Counts der Zeilenanzahl für jeden loan_status aus.
Gib den Klassifikationsbericht mit y_test und preds_df aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create a dataframe for the probabilities of default
____ = pd.____(____[:,1], columns = ['prob_default'])

# Reassign loan status based on the threshold
____[____] = ____[____].apply(lambda x: 1 if x > ____ else 0)

# Print the row counts for each loan status
print(____[____].____())

# Print the classification report
target_names = ['Non-Default', 'Default']
print(____(____, ____['loan_status'], target_names=target_names))

Code bearbeiten und ausführen