IniziaInizia gratis

Imputazione dei valori mancanti e creazione di variabili dummy

Dopo aver rilevato valori mancanti nell'insieme di dati attrition e aver stabilito che sono mancanti completamente a caso (MCAR), decidi di usare l'imputazione con K Nearest Neighbors (KNN). Durante la configurazione della tua recipe di feature engineering, decidi di creare variabili dummy per tutte le variabili nominali e di aggiornare il ruolo della variabile ...1 a "ID" così da poterla mantenere nell'insieme di dati come riferimento, senza influenzare il tuo modello.

Questo esercizio fa parte del corso

Feature Engineering in R

Visualizza il corso

Istruzioni dell'esercizio

  • Aggiorna il ruolo di ...1 a "ID".
  • Imputa i valori per tutti i predictor dove i dati sono mancanti.
  • Crea variabili dummy per tutti i predictor nominali.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

lr_model <- logistic_reg()

lr_recipe <- 
  recipe(Attrition ~., data = train) %>%

# Update the role of "...1" to "ID"
  ___(...1, new_role = "ID" ) %>%

# Impute values to all predictors where data are missing
  step_impute_knn(___) %>%

# Create dummy variables for all nominal predictors
  ___(all_nominal_predictors())

lr_recipe
Modifica ed esegui il codice