CommencerCommencer gratuitement

Évaluer l'erreur de validation croisée à 10 blocs

Dans cet exercice, vous évaluerez l'erreur quadratique moyenne (RMSE) de la validation croisée à 10 blocs obtenue par l'arbre de régression dt que vous avez instanciée dans l'exercice précédent.

En plus de dt, les données d’entraînement, notamment X_train et y_train, sont disponibles dans votre espace de travail. Nous avons également importé cross_val_score depuis sklearn.model_selection.

Notez que, puisque cross_val_score ne permet d'évaluer que les MSE négatifs, son résultat doit être multiplié par moins un pour obtenir les MSE. La RMSE à validation croisée peut alors être obtenue en calculant la racine carrée de la MSE moyenne.

Cet exercice fait partie du cours

Machine learning avec des modèles arborescents en Python

Afficher le cours

Instructions

  • Calculez la MSE validée de façon croisée à 10 blocs de dt en définissant l'argument scoring sur 'neg_mean_squared_error'.

  • Calculez l'erreur quadratique moyenne (RMSE) à partir des scores MSE obtenus.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Compute the array containing the 10-folds CV MSEs
MSE_CV_scores = - ____(____, ____, ____, cv=____, 
                       ____='____',
                       n_jobs=-1)

# Compute the 10-folds CV RMSE
RMSE_CV = (____.____)**(____)

# Print RMSE_CV
print('CV RMSE: {:.2f}'.format(RMSE_CV))
Modifier et exécuter le code