LoslegenKostenlos loslegen

Kreditmodelle per Cross-Validation prüfen

Kredite und die dazugehörigen Daten verändern sich im Zeitverlauf und sehen nicht immer so aus wie die aktuell geladenen Testdatensätze. Daher kannst du Cross-Validation verwenden, um mehrere kleinere Trainings- und Testsets auszuprobieren, die aus dem ursprünglichen X_train und y_train abgeleitet werden.

Verwende die XGBoost-Funktion cv(), um eine Cross-Validation durchzuführen. Du musst alle Parameter einrichten, die cv() auf den Testdaten verwenden soll.

Die Datensätze X_train, y_train sind im Workspace geladen, zusammen mit dem trainierten Modell gbt und dem Parameter-Wörterbuch params, das beim Laden der Übung ausgegeben wird.

Diese Übung ist Teil des Kurses

Kreditrisikomodellierung in Python

Kurs anzeigen

Anleitung zur Übung

  • Setze die Anzahl der Folds auf 5 und das Early Stopping auf 10. Speichere sie als n_folds und early_stopping.
  • Erstelle das Matrix-Objekt DTrain mit den Trainingsdaten.
  • Verwende cv() mit den Parametern, den Folds und dem Early-Stopping-Objekt. Speichere die Ergebnisse als cv_df.
  • Gib den Inhalt von cv_df aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Set the values for number of folds and stopping iterations
____ = ____
____ = ____

# Create the DTrain matrix for XGBoost
____ = xgb.____(____, label = ____)

# Create the data frame of cross validations
____ = xgb.cv(____, ____, num_boost_round = 5, nfold=____,
            early_stopping_rounds=____)

# Print the cross validations data frame
____(____)
Code bearbeiten und ausführen