Erstelle einen Recipe-Model-Workflow
Das Paket tidymodels kann Rezepte und Modelle in Workflows kombinieren. Workflows erleichtern es, eine Pipeline von Schritten zu erstellen, um Daten vorzubereiten und Modelle zu trainieren. Workflows können dann leicht auf neue Daten angewendet werden, ohne alle Vorverarbeitungs- und Modellierungsschritte neu definieren zu müssen. Praktischerweise haben Workflows eine fit()-Funktion, die sowohl das Rezept als auch das Modell an die Daten anpasst.
In dieser Übung übst du, ein Rezept und ein Modell zu erstellen und sie zu einem Workflow hinzuzufügen, sodass sie bereit sind, an die Daten angepasst zu werden. Die train- und test-Sets der Employee-Healthcare-Attrition-Daten stehen dir zur Verfügung. Die Zielvariable ist Attrition.
Die Pakete tidyverse und tidymodels wurden bereits für dich geladen.
Diese Übung ist Teil des Kurses
Dimensionsreduktion in R
Anleitung zur Übung
- Definiere ein Rezept mit den
train-Daten mitstep_filter_missing(),step_scale()undstep_nzv(), um NAs zu entfernen, die numerischen Features zu skalieren und Features mit geringer Varianz zu entfernen. Verwende fürstep_filter_missing()einen Schwellenwert von 0,5. - Definiere ein logistisches Regressionsmodell mit der Engine "glm".
- Füge
feature_selection_recipeundlr_modelzu einem Workflow namensattrition_wflowhinzu.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create recipe
feature_selection_recipe <-
___(___ ~ ., data = ___) %>%
___(___(), threshold = 0.5) %>%
___(___()) %>%
___(___()) %>%
prep()
# Create model
lr_model <- ___() %>%
___("___")
# Add recipe and model to a workflow
attrition_wflow <- ___() %>%
___(___) %>%
___(___)