Ablauf des Feature Engineerings
Um Feature Engineering in den Modellierungsprozess einzubinden, müssen Trainings- und Testdatensätze vor dem Fitten des Modells vorverarbeitet werden. Mit den neuen Fähigkeiten aus diesem Kapitel kannst du alle verfügbaren Prädiktorvariablen in den Telekommunikationsdaten nutzen, um dein logistisches Regressionsmodell zu trainieren.
In dieser Übung erstellst du eine Feature-Engineering-Pipeline für die Telekommunikationsdaten und verwendest sie, um die Trainings- und Testdatensätze zu transformieren.
Die Datensätze telecom_training und telecom_test sowie deine Modell-Spezifikation für die logistische Regression, logistic_model, wurden in deine Session geladen.
Diese Übung ist Teil des Kurses
Modellierung mit tidymodels in R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
telecom_recipe <- recipe(___, data = ___) %>%
# Removed correlated predictors
___(___) %>%
# Log transform numeric predictors
___(___, base = 10) %>%
# Normalize numeric predictors
___(___) %>%
# Create dummy variables
___(___, ___)