Préparer et découper
Vous allez travailler avec l’intégralité du jeu de données attrition comprenant 1 470 instances et 30 variables explicatives liées à la variable cible Attrition, avec des valeurs manquantes. Votre mission est de construire un modèle complet de bout en bout pour prédire la cible. Le jeu de données est déjà chargé pour vous.
Vous allez commencer par préparer et découper les données.
Cet exercice fait partie du cours
Feature engineering en R
Instructions
- Commencez par convertir toutes les valeurs de type caractère en facteurs.
- Créez des partitions d’entraînement et de test.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Transform all character values to factors
attrition <-
attrition %>%
mutate(___(where(___), as_factor))
# Create train and test splits
set.seed(123)
split <- initial_split(attrition, strata = Attrition)
test <- ___(split)
train <- ___(___)
glimpse(train)