Ab in die Matrix
Du hast sechs unterschiedliche Werte für EducationField gefunden. Du vermutest aber, dass weitere auftauchen, wenn du das Modell auf neue Daten anwendest. Um dich darauf vorzubereiten, erstellst du einen Hash-Index mit 50 Begriffen. Das Paket textrecipes sowie die Splits attrition_train und attrition_test sind bereits geladen.
Diese Übung ist Teil des Kurses
<Kurs>Feature Engineering in R</Kurs>Übungsanweisungen
- Füge der Recipe einen Schritt hinzu, der einen dummy_hash-Index für
EducationFielderzeugt. - Bereite die Recipe vor.
- Backe die vorbereitete Recipe.
- Verbinde die gebackene Recipe-Tabelle und die
EducationField-Werte zu einer Tabelle und gib die ersten 7 Zeilen sowie die Spalten 1 und 18 bis 20 aus.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
recipe <- recipe(~EducationField, data = attrition_train) %>%
# Add a step to the recipe that generates a dummy_hash index for EducationField
___(EducationField, prefix = NULL, signed = FALSE, num_terms = 50L)
# Prepare the recipe
object <- recipe %>%
___
# Bake the prepped recipe
baked <- ___(object, new_data = attrition_test)
# Bind the baked recipe table and the EducationField values into one table
bind_cols(___, baked)[1:7,c(1,18:20)]