LoslegenKostenlos loslegen

Ab in die Matrix

Du hast sechs unterschiedliche Werte für EducationField gefunden. Du vermutest aber, dass weitere auftauchen, wenn du das Modell auf neue Daten anwendest. Um dich darauf vorzubereiten, erstellst du einen Hash-Index mit 50 Begriffen. Das Paket textrecipes sowie die Splits attrition_train und attrition_test sind bereits geladen.

Diese Übung ist Teil des Kurses

Feature Engineering in R

Kurs anzeigen

Anleitung zur Übung

  • Füge der Recipe einen Schritt hinzu, der einen dummy_hash-Index für EducationField erzeugt.
  • Bereite die Recipe vor.
  • Backe die vorbereitete Recipe.
  • Verbinde die gebackene Recipe-Tabelle und die EducationField-Werte zu einer Tabelle und gib die ersten 7 Zeilen sowie die Spalten 1 und 18 bis 20 aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

recipe <- recipe(~EducationField, data = attrition_train) %>%
# Add a step to the recipe that generates a dummy_hash index for EducationField
  ___(EducationField, prefix = NULL, signed = FALSE, num_terms = 50L)

# Prepare the recipe
object <- recipe %>%
  ___

# Bake the prepped recipe
baked <- ___(object, new_data = attrition_test)

# Bind the baked recipe table and the EducationField values into one table
bind_cols(___, baked)[1:7,c(1,18:20)]
Code bearbeiten und ausführen