Maak een recipe-modelworkflow
Met het pakket tidymodels kun je recipes en modellen combineren in workflows. Workflows maken het eenvoudig om een pijplijn van stappen te bouwen om data voor te bereiden en modellen te trainen. Je kunt workflows vervolgens makkelijk toepassen op nieuwe data, zonder alle preprocessing- en modelbouwstappen opnieuw te hoeven definiëren. Handig genoeg hebben workflows een fit()-functie die zowel de recipe als het model op de data fit.
In deze oefening ga je een recipe en een model maken en ze toevoegen aan een workflow, zodat ze klaar zijn om op de data te worden gefit. De train- en test-sets van de personeelsdata over zorggerelateerd verloop staan voor je klaar. De doelvariabele is Attrition.
De pakketten tidyverse en tidymodels zijn voor je geladen.
Deze oefening maakt deel uit van de cursus
Dimensionality Reduction in R
Oefeninstructies
- Definieer een recipe met de
train-data met eenstep_filter_missing(),step_scale()enstep_nzv()om respectievelijk NA's te verwijderen, de numerieke features te schalen en features met lage variantie te verwijderen. Gebruik een drempel van 0,5 voorstep_filter_missing(). - Definieer een logistisch regressiemodel met de "glm"-engine.
- Voeg
feature_selection_recipeenlr_modeltoe aan een workflow met de naamattrition_wflow.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create recipe
feature_selection_recipe <-
___(___ ~ ., data = ___) %>%
___(___(), threshold = 0.5) %>%
___(___()) %>%
___(___()) %>%
prep()
# Create model
lr_model <- ___() %>%
___("___")
# Add recipe and model to a workflow
attrition_wflow <- ___() %>%
___(___) %>%
___(___)