CommencerCommencer gratuitement

Dans la matrice

Vous avez identifié six valeurs distinctes pour EducationField. Mais vous soupçonnez que d’autres pourraient apparaître lorsque vous exécuterez le modèle sur de nouvelles données. Pour vous y préparer, vous allez créer un index de hachage avec 50 termes. Le package textrecipes ainsi que les partitions attrition_train et attrition_test sont déjà chargés.

Cet exercice fait partie du cours

Feature engineering en R

Afficher le cours

Instructions

  • Ajoutez une étape à la recette qui génère un index dummy_hash pour EducationField.
  • Préparez la recette.
  • Cuisinez (bake) la recette préparée.
  • Fusionnez la table issue du bake et les valeurs de EducationField en une seule table, puis affichez les 7 premières lignes ainsi que les colonnes 1 et 18 à 20.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

recipe <- recipe(~EducationField, data = attrition_train) %>%
# Add a step to the recipe that generates a dummy_hash index for EducationField
  ___(EducationField, prefix = NULL, signed = FALSE, num_terms = 50L)

# Prepare the recipe
object <- recipe %>%
  ___

# Bake the prepped recipe
baked <- ___(object, new_data = attrition_test)

# Bind the baked recipe table and the EducationField values into one table
bind_cols(___, baked)[1:7,c(1,18:20)]
Modifier et exécuter le code