IniziaInizia gratis

Rimozione di predittori correlati con recipes

Rimuovere variabili predittive correlate dai tuoi insiemi di dati di training e test è un passaggio importante di feature engineering per far sì che l’addestramento del modello proceda nel modo più fluido possibile.

Ora che hai scoperto che monthly_charges e avg_data_gb sono altamente correlati, devi aggiungere un filtro di correlazione con step_corr() alla tua pipeline di feature engineering per i dati di telecomunicazioni.

In questo esercizio creerai un oggetto recipe che rimuove i predittori correlati dai dati di telecomunicazioni.

I dataset telecom_training e telecom_test sono già stati caricati nella tua sessione.

Questo esercizio fa parte del corso

Modellazione con tidymodels in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Specify a recipe object
telecom_cor_rec <- recipe(___,
                          data = ___) %>%
  # Remove correlated variables
  ___(___, threshold = ___)
Modifica ed esegui il codice