LoslegenKostenlos loslegen

Spaltenauswahl und Modellleistung

Das Erstellen des Trainingssatzes aus verschiedenen Kombinationen von Spalten beeinflusst das Modell und die Wichtigkeitswerte der Spalten. Führt eine andere Auswahl von Spalten auch zu anderen F1-Scores, also der Kombination aus precision und recall, des Modells? Du kannst diese Frage beantworten, indem du zwei verschiedene Modelle auf zwei unterschiedlichen Spaltensätzen trainierst und die Leistung überprüfst.

Wenn Ausfälle fälschlicherweise als Nicht-Ausfälle vorhergesagt werden, kann das zu unerwarteten Verlusten führen – besonders wenn die Ausfallwahrscheinlichkeit dieser Kredite sehr gering war. Du kannst den F1-Score für Ausfälle nutzen, um zu sehen, wie gut die Modelle Ausfälle korrekt vorhersagen.

Die Kreditdaten cr_loan_prep und die beiden Trainingsspaltensätze X und X2 sind im Workspace geladen. Die Modelle gbt und gbt2 wurden bereits trainiert.

Diese Übung ist Teil des Kurses

Kreditrisikomodellierung in Python

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Predict the loan_status using each model
____ = gbt.____(____)
____ = gbt2.____(____)

# Print the classification report of the first model
target_names = ['Non-Default', 'Default']
print(____(____, ____, target_names=target_names))

# Print the classification report of the second model
print(____(____, ____, target_names=target_names))
Code bearbeiten und ausführen