Proces voor feature engineering
Om feature engineering in het modelleerproces op te nemen, moeten de trainings- en testgegevenssets worden voorbewerkt vóór het model-fitstadium. Met de nieuwe vaardigheden uit dit hoofdstuk kun je alle beschikbare predictorvariabelen in de telecomgegevens gebruiken om je logistieke regressiemodel te trainen.
In deze oefening maak je een feature-engineeringpipeline voor de telecomgegevens en gebruik je die om de trainings- en testgegevenssets te transformeren.
De gegevenssets telecom_training en telecom_test, evenals je specificatie van het logistieke regressiemodel, logistic_model, zijn in je sessie geladen.
Deze oefening maakt deel uit van de cursus
Modelleren met tidymodels in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
telecom_recipe <- recipe(___, data = ___) %>%
# Removed correlated predictors
___(___) %>%
# Log transform numeric predictors
___(___, base = 10) %>%
# Normalize numeric predictors
___(___) %>%
# Create dummy variables
___(___, ___)