CommencerCommencer gratuitement

Supprimer les prédicteurs corrélés avec recipes

Supprimer les variables prédictives corrélées de vos jeux d’entraînement et de test est une étape essentielle de feature engineering pour que l’ajustement de votre modèle se déroule au mieux.

Maintenant que vous avez constaté que monthly_charges et avg_data_gb sont fortement corrélées, vous devez ajouter un filtre de corrélation avec step_corr() à votre pipeline de feature engineering pour les données de télécommunications.

Dans cet exercice, vous allez créer un objet recipe qui supprime les prédicteurs corrélés des données de télécommunications.

Les jeux de données telecom_training et telecom_test ont été chargés dans votre session.

Cet exercice fait partie du cours

Modéliser avec tidymodels en R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Specify a recipe object
telecom_cor_rec <- recipe(___,
                          data = ___) %>%
  # Remove correlated variables
  ___(___, threshold = ___)
Modifier et exécuter le code