Komplette Feature-Engineering-Pipeline
Das Paket recipes ist dafür gedacht, mehrere Feature-Engineering-Schritte in einem Objekt zu bündeln. So lassen sich Datentransformationen in einem Machine-Learning-Workflow leichter verwalten.
In dieser Übung trainierst du eine Feature-Engineering-Pipeline, um die Telekommunikationsdaten für das Modeling aufzubereiten.
Das Tibble telecom_df sowie deine Datensätze telecom_training und telecom_test aus den vorherigen Übungen sind in deinem Workspace geladen.
Diese Übung ist Teil des Kurses
<Kurs>Modellierung mit tidymodels in R</Kurs>Übungsanweisungen
- Erstelle ein Recipe, das
canceled_serviceanhand aller Prädiktorvariablen in den Trainingsdaten vorhersagt. - Entferne korrelierte Prädiktoren mit einem Schwellenwert von 0,8.
- Normalisiere alle numerischen Prädiktoren.
- Erstelle Dummy-Variablen für alle nominalen Prädiktoren.
- Trainiere dein Recipe auf den Trainingsdaten und wende es auf die Testdaten an.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create a recipe that predicts canceled_service using the training data
telecom_recipe <- ___ %>%
# Remove correlated predictors
___ %>%
# Normalize numeric predictors
___ %>%
# Create dummy variables
___
# Train your recipe and apply it to the test data
telecom_recipe %>%
___ %>%
___