LoslegenKostenlos loslegen

Komplette Feature-Engineering-Pipeline

Das Paket recipes ist dafür gedacht, mehrere Feature-Engineering-Schritte in einem Objekt zu bündeln. So lassen sich Datentransformationen in einem Machine-Learning-Workflow leichter verwalten.

In dieser Übung trainierst du eine Feature-Engineering-Pipeline, um die Telekommunikationsdaten für das Modeling aufzubereiten.

Das Tibble telecom_df sowie deine Datensätze telecom_training und telecom_test aus den vorherigen Übungen sind in deinem Workspace geladen.

Diese Übung ist Teil des Kurses

Modellierung mit tidymodels in R

Kurs anzeigen

Anleitung zur Übung

  • Erstelle ein Recipe, das canceled_service anhand aller Prädiktorvariablen in den Trainingsdaten vorhersagt.
  • Entferne korrelierte Prädiktoren mit einem Schwellenwert von 0,8.
  • Normalisiere alle numerischen Prädiktoren.
  • Erstelle Dummy-Variablen für alle nominalen Prädiktoren.
  • Trainiere dein Recipe auf den Trainingsdaten und wende es auf die Testdaten an.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create a recipe that predicts canceled_service using the training data
telecom_recipe <- ___ %>% 
  # Remove correlated predictors
  ___ %>% 
  # Normalize numeric predictors
  ___ %>% 
  # Create dummy variables
  ___

# Train your recipe and apply it to the test data
telecom_recipe %>% 
  ___ %>% 
  ___
Code bearbeiten und ausführen