Rimozione di predittori correlati con recipes
Rimuovere variabili predittive correlate dai tuoi insiemi di dati di training e test è un passaggio importante di feature engineering per far sì che l’addestramento del modello proceda nel modo più fluido possibile.
Ora che hai scoperto che monthly_charges e avg_data_gb sono altamente correlati, devi aggiungere un filtro di correlazione con step_corr() alla tua pipeline di feature engineering per i dati di telecomunicazioni.
In questo esercizio creerai un oggetto recipe che rimuove i predittori correlati dai dati di telecomunicazioni.
I dataset telecom_training e telecom_test sono già stati caricati nella tua sessione.
Questo esercizio fa parte del corso
Modellazione con tidymodels in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Specify a recipe object
telecom_cor_rec <- recipe(___,
data = ___) %>%
# Remove correlated variables
___(___, threshold = ___)