ComenzarEmpieza gratis

Al interior de la matriz

Has identificado seis valores distintos para EducationField. Pero sospechas que podrían aparecer otros cuando ejecutes el modelo con datos nuevos. Para prepararte, crearás un índice hash con 50 términos. El paquete textrecipes y las particiones attrition_train y attrition_test ya están cargadas.

Este ejercicio forma parte del curso

Ingeniería de características en R

Ver curso

Instrucciones del ejercicio

  • Añade un paso a la receta que genere un índice dummy_hash para EducationField.
  • Prepara la receta.
  • Hornea (bake) la receta preparada.
  • Une la tabla horneada de la receta y los valores de EducationField en una sola tabla e imprime las primeras 7 filas, así como las columnas 1 y de la 18 a la 20.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

recipe <- recipe(~EducationField, data = attrition_train) %>%
# Add a step to the recipe that generates a dummy_hash index for EducationField
  ___(EducationField, prefix = NULL, signed = FALSE, num_terms = 50L)

# Prepare the recipe
object <- recipe %>%
  ___

# Bake the prepped recipe
baked <- ___(object, new_data = attrition_test)

# Bind the baked recipe table and the EducationField values into one table
bind_cols(___, baked)[1:7,c(1,18:20)]
Editar y ejecutar código