CommencerCommencer gratuitement

Entraîner le modèle

La spécification d’un modèle est un bon début, comme une toile pour un peintre. Mais tout comme le peintre a besoin de couleurs, la spécification a besoin de données. Seul le modèle final peut produire des prédictions :

Spécification du modèle + données = modèle

Dans cet exercice, vous allez entraîner un arbre de décision qui modélise le risque de diabète à partir de variables de santé comme prédicteurs. La variable de réponse, outcome, indique si le patient est diabétique ou non ; il s’agit donc d’un problème de classification binaire (il n’y a que deux classes). Le jeu de données contient aussi des variables de santé des patients telles que blood_pressure, age et bmi.

Pour le reste du cours, le package tidymodels sera toujours préchargé. Dans cet exercice, le jeu de données diabetes est également disponible dans votre espace de travail.

Cet exercice fait partie du cours

Machine Learning avec des modèles à base d’arbres en R

Afficher le cours

Instructions

  • Créez tree_spec, une spécification d’arbre de décision avec le moteur rpart.
  • Entraînez un modèle tree_model_bmi, où outcome dépend uniquement du prédicteur bmi, en ajustant le jeu de données diabetes à la spécification.
  • Affichez le modèle dans la console.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create the specification
tree_spec <- ___() %>% 
  ___("rpart") %>% 
  ___

# Train the model
tree_model_bmi <- tree_spec %>% 
  ___

# Print the model
___
Modifier et exécuter le code