Aan de slagGa gratis aan de slag

Preprocessen

Tijd voor feature engineering! Je gaat een recipe bouwen om niet-informatieve maar mogelijk waardevolle variabelen zoals een observatie-ID te verwerken en om te gaan met missende waarden. Dit is ook een kans om enkele voorspellers te transformeren. Normaliseer bijvoorbeeld numerieke features en maak dummyvariabelen voor categorische features.

De gegevensset attrition en de train- en test-splits die je in de vorige oefening hebt gemaakt, zijn beschikbaar in je omgeving.

Deze oefening maakt deel uit van de cursus

Feature engineering in R

Cursus bekijken

Oefeninstructies

  • Normaliseer alle numerieke features.
  • Imputeer missende waarden met het knn-imputatie-algoritme.
  • Maak dummyvariabelen voor alle nominale voorspellers.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

recipe <- recipe(Attrition ~ ., data = train) %>%
  update_role(...1, new_role = "ID") %>%

# Normalize all numeric features
  ___(all_numeric_predictors()) %>% 

# Impute missing values using the knn imputation algorithm
  ___(all_predictors()) %>%

# Create dummy variables for all nominal predictors
  ___(all_nominal_predictors())
 
recipe
Code bewerken en uitvoeren