CommencerCommencez gratuitement

Évaluer l'erreur de validation croisée à 10 blocs

Dans cet exercice, vous évaluerez l'erreur quadratique moyenne (RMSE) de la validation croisée à 10 blocs obtenue par l'arbre de régression dt que vous avez instanciée dans l'exercice précédent.

En plus de dt, les données d’entraînement, notamment X_train et y_train, sont disponibles dans votre espace de travail. Nous avons également importé cross_val_score depuis sklearn.model_selection.

Notez que, puisque cross_val_score ne permet d'évaluer que les MSE négatifs, son résultat doit être multiplié par moins un pour obtenir les MSE. La RMSE à validation croisée peut alors être obtenue en calculant la racine carrée de la MSE moyenne.

Cet exercice fait partie du cours

<cours>Machine learning avec des modèles arborescents en Python</cours>
Voir le cours

Instructions de l’exercice

  • Calculez la MSE validée de façon croisée à 10 blocs de dt en définissant l'argument scoring sur 'neg_mean_squared_error'.

  • Calculez l'erreur quadratique moyenne (RMSE) à partir des scores MSE obtenus.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Compute the array containing the 10-folds CV MSEs
MSE_CV_scores = - ____(____, ____, ____, cv=____, 
                       ____='____',
                       n_jobs=-1)

# Compute the 10-folds CV RMSE
RMSE_CV = (____.____)**(____)

# Print RMSE_CV
print('CV RMSE: {:.2f}'.format(RMSE_CV))
Modifier et exécuter le code