Ajuster les folds
Maintenant que vous avez découpé vos données en folds, il est temps de les utiliser pour entraîner le modèle et calculer l’erreur hors échantillon de chaque modèle. Vous obtenez ainsi une estimation équilibrée des performances de votre spécification, puisque vous l’évaluez plusieurs fois hors échantillon.
chocolate_folds est disponible dans votre espace de travail ; vous l’avez créé dans l’exercice précédent (10 folds issus de l’ensemble d’entraînement sur le chocolat).
Cet exercice fait partie du cours
Machine Learning avec des modèles à base d’arbres en R
Instructions
- Montrez que vous maîtrisez toujours : créez
tree_spec, une spécification d’arbre de régression utilisant le moteur"rpart". - Utilisez
fit_resamples()pour ajuster vos folds avectree_spec, en modélisantfinal_gradeà partir de tous les autres prédicteurs et en évaluant à la fois avec MAE et RMSE.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a specification
tree_spec <- ___ %>%
___
___
# Fit all folds to the specification
fits_cv <- ___(tree_spec,
___,
resamples = ___,
metrics = ___)
fits_cv