Aan de slagGa gratis aan de slag

Maak een recipe-modelworkflow

Met het pakket tidymodels kun je recipes en modellen combineren in workflows. Workflows maken het eenvoudig om een pijplijn van stappen te bouwen om data voor te bereiden en modellen te trainen. Je kunt workflows vervolgens makkelijk toepassen op nieuwe data, zonder alle preprocessing- en modelbouwstappen opnieuw te hoeven definiëren. Handig genoeg hebben workflows een fit()-functie die zowel de recipe als het model op de data fit.

In deze oefening ga je een recipe en een model maken en ze toevoegen aan een workflow, zodat ze klaar zijn om op de data te worden gefit. De train- en test-sets van de personeelsdata over zorggerelateerd verloop staan voor je klaar. De doelvariabele is Attrition.

De pakketten tidyverse en tidymodels zijn voor je geladen.

Deze oefening maakt deel uit van de cursus

Dimensionality Reduction in R

Cursus bekijken

Oefeninstructies

  • Definieer een recipe met de train-data met een step_filter_missing(), step_scale() en step_nzv() om respectievelijk NA's te verwijderen, de numerieke features te schalen en features met lage variantie te verwijderen. Gebruik een drempel van 0,5 voor step_filter_missing().
  • Definieer een logistisch regressiemodel met de "glm"-engine.
  • Voeg feature_selection_recipe en lr_model toe aan een workflow met de naam attrition_wflow.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create recipe
feature_selection_recipe <- 
  ___(___ ~ ., data = ___) %>% 
  ___(___(), threshold = 0.5) %>% 
  ___(___()) %>% 
  ___(___()) %>% 
  prep()
  
# Create model
lr_model <- ___() %>% 
  ___("___")

# Add recipe and model to a workflow
attrition_wflow <- ___() %>% 
  ___(___) %>% 
  ___(___)
Code bewerken en uitvoeren