Kreditmodelle per Cross-Validation prüfen
Kredite und die dazugehörigen Daten verändern sich im Zeitverlauf und sehen nicht immer so aus wie die aktuell geladenen Testdatensätze. Daher kannst du Cross-Validation verwenden, um mehrere kleinere Trainings- und Testsets auszuprobieren, die aus dem ursprünglichen X_train und y_train abgeleitet werden.
Verwende die XGBoost-Funktion cv(), um eine Cross-Validation durchzuführen. Du musst alle Parameter einrichten, die cv() auf den Testdaten verwenden soll.
Die Datensätze X_train, y_train sind im Workspace geladen, zusammen mit dem trainierten Modell gbt und dem Parameter-Wörterbuch params, das beim Laden der Übung ausgegeben wird.
Diese Übung ist Teil des Kurses
Kreditrisikomodellierung in Python
Anleitung zur Übung
- Setze die Anzahl der Folds auf
5und das Early Stopping auf10. Speichere sie alsn_foldsundearly_stopping. - Erstelle das Matrix-Objekt
DTrainmit den Trainingsdaten. - Verwende
cv()mit den Parametern, den Folds und dem Early-Stopping-Objekt. Speichere die Ergebnisse alscv_df. - Gib den Inhalt von
cv_dfaus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Set the values for number of folds and stopping iterations
____ = ____
____ = ____
# Create the DTrain matrix for XGBoost
____ = xgb.____(____, label = ____)
# Create the data frame of cross validations
____ = xgb.cv(____, ____, num_boost_round = 5, nfold=____,
early_stopping_rounds=____)
# Print the cross validations data frame
____(____)