Processus de feature engineering
Pour intégrer le feature engineering au processus de modélisation, les jeux de données d’entraînement et de test doivent être prétraités avant l’étape d’ajustement du modèle. Avec les nouvelles compétences acquises dans ce chapitre, vous pourrez utiliser toutes les variables prédictives disponibles dans les données de télécommunications pour entraîner votre modèle de régression logistique.
Dans cet exercice, vous allez créer un pipeline de feature engineering sur les données de télécommunications et l’utiliser pour transformer les jeux de données d’entraînement et de test.
Les jeux de données telecom_training et telecom_test, ainsi que votre spécification de modèle de régression logistique, logistic_model, ont été chargés dans votre session.
Cet exercice fait partie du cours
Modéliser avec tidymodels en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
telecom_recipe <- recipe(___, data = ___) %>%
# Removed correlated predictors
___(___) %>%
# Log transform numeric predictors
___(___, base = 10) %>%
# Normalize numeric predictors
___(___) %>%
# Create dummy variables
___(___, ___)