Supprimer les prédicteurs corrélés avec recipes
Supprimer les variables prédictives corrélées de vos jeux d’entraînement et de test est une étape essentielle de feature engineering pour que l’ajustement de votre modèle se déroule au mieux.
Maintenant que vous avez constaté que monthly_charges et avg_data_gb sont fortement corrélées, vous devez ajouter un filtre de corrélation avec step_corr() à votre pipeline de feature engineering pour les données de télécommunications.
Dans cet exercice, vous allez créer un objet recipe qui supprime les prédicteurs corrélés des données de télécommunications.
Les jeux de données telecom_training et telecom_test ont été chargés dans votre session.
Cet exercice fait partie du cours
Modéliser avec tidymodels en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Specify a recipe object
telecom_cor_rec <- recipe(___,
data = ___) %>%
# Remove correlated variables
___(___, threshold = ___)