Dans la matrice
Vous avez identifié six valeurs distinctes pour EducationField. Mais vous soupçonnez que d’autres pourraient apparaître lorsque vous exécuterez le modèle sur de nouvelles données. Pour vous y préparer, vous allez créer un index de hachage avec 50 termes. Le package textrecipes ainsi que les partitions attrition_train et attrition_test sont déjà chargés.
Cet exercice fait partie du cours
Feature engineering en R
Instructions
- Ajoutez une étape à la recette qui génère un index dummy_hash pour
EducationField. - Préparez la recette.
- Cuisinez (bake) la recette préparée.
- Fusionnez la table issue du bake et les valeurs de
EducationFielden une seule table, puis affichez les 7 premières lignes ainsi que les colonnes 1 et 18 à 20.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
recipe <- recipe(~EducationField, data = attrition_train) %>%
# Add a step to the recipe that generates a dummy_hash index for EducationField
___(EducationField, prefix = NULL, signed = FALSE, num_terms = 50L)
# Prepare the recipe
object <- recipe %>%
___
# Bake the prepped recipe
baked <- ___(object, new_data = attrition_test)
# Bind the baked recipe table and the EducationField values into one table
bind_cols(___, baked)[1:7,c(1,18:20)]