Entraîner un arbre de régression
Comme vous le savez déjà, les arbres de décision sont utiles pour les problèmes de classification. Vous pouvez également les utiliser pour modéliser des problèmes de régression. La différence structurelle est qu’il y aura des valeurs numériques (au lieu de classes) sur les nœuds feuilles.
Dans cet exercice, vous allez utiliser le jeu de données sur le chocolat pour ajuster un arbre de régression. C’est très proche de ce que vous avez déjà fait au chapitre 1 avec le jeu de données diabetes.
Les données d’entraînement chocolate_train sont disponibles dans votre espace de travail.
Cet exercice fait partie du cours
Machine Learning avec des modèles à base d’arbres en R
Instructions
- Créez
model_spec, une spécification d’arbre de régression. - À partir du data frame
chocolate_train, utilisezmodel_specpour entraîner un arbre de régression qui préditfinal_gradeen n’utilisant que les prédicteurs numériques présents dans les données.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
library(tidymodels)
# Build the specification
model_spec <- decision_tree() %>%
set_mode(___) %>%
set_engine(___)
# Fit to the data
model_fit <- model_spec %>%
___(formula = ___,
data = ___)
model_fit