Processo di feature engineering
Per integrare il feature engineering nel processo di modellazione, gli insiemi di dati di training e di test devono essere preprocessati prima della fase di stima del modello. Con le nuove competenze che hai acquisito in questo capitolo, potrai usare tutte le variabili predittive disponibili nei dati delle telecomunicazioni per addestrare il tuo modello di regressione logistica.
In questo esercizio creerai una pipeline di feature engineering sui dati delle telecomunicazioni e la userai per trasformare i dataset di training e di test.
I dataset telecom_training e telecom_test, così come la specifica del tuo modello di regressione logistica, logistic_model, sono già stati caricati nella tua sessione.
Questo esercizio fa parte del corso
Modellazione con tidymodels in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
telecom_recipe <- recipe(___, data = ___) %>%
# Removed correlated predictors
___(___) %>%
# Log transform numeric predictors
___(___, base = 10) %>%
# Normalize numeric predictors
___(___) %>%
# Create dummy variables
___(___, ___)