CommencerCommencer gratuitement

Validation croisée des modèles de crédit

Les prêts et leurs données évoluent dans le temps, et ils ne ressembleront pas toujours à ce qui est chargé dans les jeux de test actuels. Vous pouvez donc utiliser la validation croisée pour essayer plusieurs jeux d’entraînement et de test plus petits, dérivés de X_train et y_train d’origine.

Utilisez la fonction XGBoost cv() pour effectuer une validation croisée. Vous devrez configurer tous les paramètres que cv() utilisera sur les données de test.

Les jeux de données X_train, y_train sont chargés dans l’espace de travail, ainsi que le modèle entraîné gbt et le dictionnaire de paramètres params, qui s’affichera au chargement de l’exercice.

Cet exercice fait partie du cours

Modélisation du risque de crédit en Python

Afficher le cours

Instructions

  • Définissez le nombre de folds à 5 et l’arrêt anticipé à 10. Stockez-les dans n_folds et early_stopping.
  • Créez l’objet matrice DTrain à partir des données d’entraînement.
  • Utilisez cv() avec les paramètres, les folds et l’arrêt anticipé. Stockez les résultats dans cv_df.
  • Affichez le contenu de cv_df.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Set the values for number of folds and stopping iterations
____ = ____
____ = ____

# Create the DTrain matrix for XGBoost
____ = xgb.____(____, label = ____)

# Create the data frame of cross validations
____ = xgb.cv(____, ____, num_boost_round = 5, nfold=____,
            early_stopping_rounds=____)

# Print the cross validations data frame
____(____)
Modifier et exécuter le code