Al interior de la matriz
Has identificado seis valores distintos para EducationField. Pero sospechas que podrían aparecer otros cuando ejecutes el modelo con datos nuevos. Para prepararte, crearás un índice hash con 50 términos. El paquete textrecipes y las particiones attrition_train y attrition_test ya están cargadas.
Este ejercicio forma parte del curso
Ingeniería de características en R
Instrucciones del ejercicio
- Añade un paso a la receta que genere un índice dummy_hash para
EducationField. - Prepara la receta.
- Hornea (bake) la receta preparada.
- Une la tabla horneada de la receta y los valores de
EducationFielden una sola tabla e imprime las primeras 7 filas, así como las columnas 1 y de la 18 a la 20.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
recipe <- recipe(~EducationField, data = attrition_train) %>%
# Add a step to the recipe that generates a dummy_hash index for EducationField
___(EducationField, prefix = NULL, signed = FALSE, num_terms = 50L)
# Prepare the recipe
object <- recipe %>%
___
# Bake the prepped recipe
baked <- ___(object, new_data = attrition_test)
# Bind the baked recipe table and the EducationField values into one table
bind_cols(___, baked)[1:7,c(1,18:20)]