Découpage entraînement/test
Pour évaluer vos modèles, vous devez les entraîner et les tester sur deux parties distinctes des données — sinon, c’est un peu comme tricher à un examen (vous connaissez déjà les réponses).
Le découpage des données fait partie intégrante du processus de modélisation. Vous allez vous y exercer en scindant les données sur le diabète et en vérifiant les proportions obtenues.
Les données diabetes de l’exercice précédent sont préchargées dans votre espace de travail.
Cet exercice fait partie du cours
Machine Learning avec des modèles à base d’arbres en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create the split
diabetes_split <- ___(___, prop = ___)
# Print the data split
___