Komplette Feature-Engineering-Pipeline
Das Paket recipes ist dafür gedacht, mehrere Feature-Engineering-Schritte in einem Objekt zu bündeln. So lassen sich Datentransformationen in einem Machine-Learning-Workflow leichter verwalten.
In dieser Übung trainierst du eine Feature-Engineering-Pipeline, um die Telekommunikationsdaten für das Modeling aufzubereiten.
Das Tibble telecom_df sowie deine Datensätze telecom_training und telecom_test aus den vorherigen Übungen sind in deinem Workspace geladen.
Diese Übung ist Teil des Kurses
Modellierung mit tidymodels in R
Anleitung zur Übung
- Erstelle ein Recipe, das
canceled_serviceanhand aller Prädiktorvariablen in den Trainingsdaten vorhersagt. - Entferne korrelierte Prädiktoren mit einem Schwellenwert von 0,8.
- Normalisiere alle numerischen Prädiktoren.
- Erstelle Dummy-Variablen für alle nominalen Prädiktoren.
- Trainiere dein Recipe auf den Trainingsdaten und wende es auf die Testdaten an.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a recipe that predicts canceled_service using the training data
telecom_recipe <- ___ %>%
# Remove correlated predictors
___ %>%
# Normalize numeric predictors
___ %>%
# Create dummy variables
___
# Train your recipe and apply it to the test data
telecom_recipe %>%
___ %>%
___