IniziaInizia gratis

Pipeline completa di feature engineering

Il pacchetto recipes è pensato per raccogliere più passaggi di feature engineering in un unico oggetto, così è più semplice mantenere le trasformazioni dei dati in un flusso di lavoro di Machine Learning.

In questo esercizio allenerai una pipeline di feature engineering per preparare i dati delle telecomunicazioni alla modellazione.

La tibble telecom_df, insieme ai tuoi insiemi di dati telecom_training e telecom_test dai precedenti esercizi, sono già caricati nel tuo workspace.

Questo esercizio fa parte del corso

Modellazione con tidymodels in R

Visualizza il corso

Istruzioni dell'esercizio

  • Crea una ricetta che predica canceled_service usando tutte le variabili predittive presenti nei dati di training.
  • Rimuovi le variabili predittive correlate usando una soglia pari a 0.8.
  • Normalizza tutti i predittori numerici.
  • Crea variabili dummy per tutti i predittori nominali.
  • Allena la tua ricetta sui dati di training e applicala ai dati di test.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create a recipe that predicts canceled_service using the training data
telecom_recipe <- ___ %>% 
  # Remove correlated predictors
  ___ %>% 
  # Normalize numeric predictors
  ___ %>% 
  # Create dummy variables
  ___

# Train your recipe and apply it to the test data
telecom_recipe %>% 
  ___ %>% 
  ___
Modifica ed esegui il codice