CommencerCommencer gratuitement

Processus de feature engineering

Pour intégrer le feature engineering au processus de modélisation, les jeux de données d’entraînement et de test doivent être prétraités avant l’étape d’ajustement du modèle. Avec les nouvelles compétences acquises dans ce chapitre, vous pourrez utiliser toutes les variables prédictives disponibles dans les données de télécommunications pour entraîner votre modèle de régression logistique.

Dans cet exercice, vous allez créer un pipeline de feature engineering sur les données de télécommunications et l’utiliser pour transformer les jeux de données d’entraînement et de test.

Les jeux de données telecom_training et telecom_test, ainsi que votre spécification de modèle de régression logistique, logistic_model, ont été chargés dans votre session.

Cet exercice fait partie du cours

Modéliser avec tidymodels en R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

telecom_recipe <- recipe(___, data = ___) %>% 
  # Removed correlated predictors
  ___(___) %>% 
  # Log transform numeric predictors
  ___(___, base = 10) %>%
  # Normalize numeric predictors
  ___(___) %>%
  # Create dummy variables
  ___(___, ___)
Modifier et exécuter le code