Preprocess
È il momento del feature engineering! Devi costruire una ricetta per gestire variabili non informative ma potenzialmente utili, come l’ID dell’osservazione, o per trattare i valori mancanti. È anche l’occasione per trasformare alcuni predittori: ad esempio, normalizzare le feature numeriche e creare variabili dummy per quelle categoriche.
Il dataset attrition e le suddivisioni train e test che hai creato nell’esercizio precedente sono disponibili nel tuo ambiente.
Questo esercizio fa parte del corso
Feature Engineering in R
Istruzioni dell'esercizio
- Normalizza tutte le feature numeriche.
- Imputa i valori mancanti usando l’algoritmo di imputazione
knn. - Crea variabili dummy per tutti i predittori nominali.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
recipe <- recipe(Attrition ~ ., data = train) %>%
update_role(...1, new_role = "ID") %>%
# Normalize all numeric features
___(all_numeric_predictors()) %>%
# Impute missing values using the knn imputation algorithm
___(all_predictors()) %>%
# Create dummy variables for all nominal predictors
___(all_nominal_predictors())
recipe