Pipeline completa di feature engineering
Il pacchetto recipes è pensato per raccogliere più passaggi di feature engineering in un unico oggetto, così è più semplice mantenere le trasformazioni dei dati in un flusso di lavoro di Machine Learning.
In questo esercizio allenerai una pipeline di feature engineering per preparare i dati delle telecomunicazioni alla modellazione.
La tibble telecom_df, insieme ai tuoi insiemi di dati telecom_training e telecom_test dai precedenti esercizi, sono già caricati nel tuo workspace.
Questo esercizio fa parte del corso
Modellazione con tidymodels in R
Istruzioni dell'esercizio
- Crea una ricetta che predica
canceled_serviceusando tutte le variabili predittive presenti nei dati di training. - Rimuovi le variabili predittive correlate usando una soglia pari a 0.8.
- Normalizza tutti i predittori numerici.
- Crea variabili dummy per tutti i predittori nominali.
- Allena la tua ricetta sui dati di training e applicala ai dati di test.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a recipe that predicts canceled_service using the training data
telecom_recipe <- ___ %>%
# Remove correlated predictors
___ %>%
# Normalize numeric predictors
___ %>%
# Create dummy variables
___
# Train your recipe and apply it to the test data
telecom_recipe %>%
___ %>%
___