Ajuster le long de la grille
Après avoir créé la grille d’ajustement et une spécification factice, vous devez ajuster un modèle à chaque point de la grille et évaluer le modèle obtenu.
C’est très simple dans le cadre tidymodels grâce à la fonction tune_grid(), comme présenté dans les diaporamas.
Dans les exercices restants, vous utiliserez le jeu de données des clients de cartes de crédit, qui contient les colonnes suivantes :
still_customer: indicateur (yes ou no) précisant si un client est toujours actiftotal_trans_amt: somme totale des transactions en USDcustomer_age: âge du clientincome_category: libellés tels que $60K - $80K ou Less than $40K indiquant la tranche de revenu annuel- … et 16 colonnes supplémentaires.
N’hésitez pas à inspecter la tibble customers dans la console ! Les résultats de l’exercice précédent, tree_grid et tune_spec, sont toujours chargés.
Cet exercice fait partie du cours
Machine Learning avec des modèles à base d’arbres en R
Instructions
- Créez trois plis de validation croisée de votre jeu de données et enregistrez-les dans
folds. - Créez
tune_resultsen ajustant la spécification le long de la grille en utilisant tous les prédicteurs pour prédirestill_customer, vos plis de CV comme rééchantillonnages, etmetric_set(accuracy). - Utilisez
autoplot()pour tracer les résultats de l’ajustement.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
set.seed(275)
# Create CV folds of the customers tibble
folds <- ___
# Tune along the grid
tune_results <- tune_grid(___,
___,
resamples = ___,
grid = ___,
metrics = ___)
# Plot the tuning results
___(tune_results)