Aan de slagGa gratis aan de slag

Proces voor feature engineering

Om feature engineering in het modelleerproces op te nemen, moeten de trainings- en testgegevenssets worden voorbewerkt vóór het model-fitstadium. Met de nieuwe vaardigheden uit dit hoofdstuk kun je alle beschikbare predictorvariabelen in de telecomgegevens gebruiken om je logistieke regressiemodel te trainen.

In deze oefening maak je een feature-engineeringpipeline voor de telecomgegevens en gebruik je die om de trainings- en testgegevenssets te transformeren.

De gegevenssets telecom_training en telecom_test, evenals je specificatie van het logistieke regressiemodel, logistic_model, zijn in je sessie geladen.

Deze oefening maakt deel uit van de cursus

Modelleren met tidymodels in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

telecom_recipe <- recipe(___, data = ___) %>% 
  # Removed correlated predictors
  ___(___) %>% 
  # Log transform numeric predictors
  ___(___, base = 10) %>%
  # Normalize numeric predictors
  ___(___) %>%
  # Create dummy variables
  ___(___, ___)
Code bewerken en uitvoeren