IniziaInizia gratis

Dentro la matrice

Hai identificato sei valori distinti per EducationField. Ma sospetti che possano comparirne altri quando esegui il modello su nuovi dati. Per prepararti, creerai un indice di hashing con 50 termini. Il pacchetto textrecipes e le partizioni attrition_train e attrition_test sono già caricate.

Questo esercizio fa parte del corso

Feature Engineering in R

Visualizza il corso

Istruzioni dell'esercizio

  • Aggiungi un passaggio alla recipe che generi un indice dummy_hash per EducationField.
  • Prepara la recipe.
  • Esegui il bake della recipe preparata.
  • Unisci la tabella ottenuta dal bake e i valori di EducationField in un'unica tabella e stampa le prime 7 righe, oltre alle colonne 1 e dalla 18 alla 20.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

recipe <- recipe(~EducationField, data = attrition_train) %>%
# Add a step to the recipe that generates a dummy_hash index for EducationField
  ___(EducationField, prefix = NULL, signed = FALSE, num_terms = 50L)

# Prepare the recipe
object <- recipe %>%
  ___

# Bake the prepped recipe
baked <- ___(object, new_data = attrition_test)

# Bind the baked recipe table and the EducationField values into one table
bind_cols(___, baked)[1:7,c(1,18:20)]
Modifica ed esegui il codice