Imputazione dei valori mancanti e creazione di variabili dummy
Dopo aver rilevato valori mancanti nell'insieme di dati attrition e aver stabilito che sono mancanti completamente a caso (MCAR), decidi di usare l'imputazione con K Nearest Neighbors (KNN). Durante la configurazione della tua recipe di feature engineering, decidi di creare variabili dummy per tutte le variabili nominali e di aggiornare il ruolo della variabile ...1 a "ID" così da poterla mantenere nell'insieme di dati come riferimento, senza influenzare il tuo modello.
Questo esercizio fa parte del corso
Feature Engineering in R
Istruzioni dell'esercizio
- Aggiorna il ruolo di
...1a "ID". - Imputa i valori per tutti i predictor dove i dati sono mancanti.
- Crea variabili dummy per tutti i predictor nominali.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
lr_model <- logistic_reg()
lr_recipe <-
recipe(Attrition ~., data = train) %>%
# Update the role of "...1" to "ID"
___(...1, new_role = "ID" ) %>%
# Impute values to all predictors where data are missing
step_impute_knn(___) %>%
# Create dummy variables for all nominal predictors
___(all_nominal_predictors())
lr_recipe