Évaluation par validation croisée
Vous allez maintenant utiliser la validation croisée avec cross_val_score() pour évaluer la performance globale.
Cet exercice est une excellente occasion de tester les hyperparamètres learning_rate et max_depth. Rappelez-vous que les hyperparamètres sont comme des réglages qui peuvent améliorer les performances.
Les jeux de données cr_loan_prep, X_train et y_train ont déjà été chargés dans l’espace de travail.
Cet exercice fait partie du cours
Modélisation du risque de crédit en Python
Instructions
- Créez un arbre de gradient boosting avec un taux d’apprentissage de
0.1et une profondeur maximale de7. Enregistrez le modèle sousgbt. - Calculez les scores de validation croisée sur les jeux de données
X_trainety_trainavec4folds. Enregistrez les résultats souscv_scores. - Affichez les scores de validation croisée.
- Affichez la précision moyenne et l’écart type avec un formatage approprié.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a gradient boosted tree model using two hyperparameters
____ = xgb.____(____ = ____, ____ = ____)
# Calculate the cross validation scores for 4 folds
____ = ____(____, ____, np.ravel(____), cv = ____)
# Print the cross validation scores
print(____)
# Print the average accuracy and standard deviation of the scores
print("Average accuracy: %0.2f (+/- %0.2f)" % (____.____(),
____.____() * 2))