Complete feature-engineeringpipeline
Het recipes-pakket is ontworpen om meerdere feature-engineeringstappen in één object te encoderen, zodat het makkelijker wordt om datatransformaties te beheren in een Machine Learning-workflow.
In deze oefening train je een feature-engineeringpipeline om de telecomgegevens voor te bereiden op modelleren.
De tibble telecom_df, evenals je telecom_training- en telecom_test-gegevenssets uit de vorige oefeningen, zijn geladen in je werkruimte.
Deze oefening maakt deel uit van de cursus
Modelleren met tidymodels in R
Oefeninstructies
- Maak een recipe die
canceled_servicevoorspelt met alle voorspellers in de trainingsgegevens. - Verwijder gecorreleerde voorspellers met een drempelwaarde van 0,8.
- Normaliseer alle numerieke voorspellers.
- Maak dummyvariabelen voor alle nominale voorspellers.
- Train je recipe op de trainingsgegevens en pas deze toe op de testgegevens.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a recipe that predicts canceled_service using the training data
telecom_recipe <- ___ %>%
# Remove correlated predictors
___ %>%
# Normalize numeric predictors
___ %>%
# Create dummy variables
___
# Train your recipe and apply it to the test data
telecom_recipe %>%
___ %>%
___