Validation croisée des modèles de crédit
Les prêts et leurs données évoluent dans le temps, et ils ne ressembleront pas toujours à ce qui est chargé dans les jeux de test actuels. Vous pouvez donc utiliser la validation croisée pour essayer plusieurs jeux d’entraînement et de test plus petits, dérivés de X_train et y_train d’origine.
Utilisez la fonction XGBoost cv() pour effectuer une validation croisée. Vous devrez configurer tous les paramètres que cv() utilisera sur les données de test.
Les jeux de données X_train, y_train sont chargés dans l’espace de travail, ainsi que le modèle entraîné gbt et le dictionnaire de paramètres params, qui s’affichera au chargement de l’exercice.
Cet exercice fait partie du cours
Modélisation du risque de crédit en Python
Instructions
- Définissez le nombre de folds à
5et l’arrêt anticipé à10. Stockez-les dansn_foldsetearly_stopping. - Créez l’objet matrice
DTrainà partir des données d’entraînement. - Utilisez
cv()avec les paramètres, les folds et l’arrêt anticipé. Stockez les résultats danscv_df. - Affichez le contenu de
cv_df.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Set the values for number of folds and stopping iterations
____ = ____
____ = ____
# Create the DTrain matrix for XGBoost
____ = xgb.____(____, label = ____)
# Create the data frame of cross validations
____ = xgb.cv(____, ____, num_boost_round = 5, nfold=____,
early_stopping_rounds=____)
# Print the cross validations data frame
____(____)