Crea una receta para valores ausentes
En los ejercicios anteriores calculaste manualmente la proporción de valores ausentes y creaste un filtro para reducir la dimensionalidad de house_sales_df. El paquete tidymodels incluye un paso de receta para aplicar automáticamente una proporción de valores ausentes: step_filter_missing(). Las ventajas del enfoque de tidymodels son que te permite reutilizar la receta en otros conjuntos de datos y simplifica el paso a un entorno de producción. En este ejercicio, usarás la función step_filter_missing() para realizar una reducción de dimensionalidad de house_sales_df basada en valores ausentes.
Los paquetes tidyverse y tidymodels ya están cargados.
Este ejercicio forma parte del curso
Reducción de la dimensionalidad en R
Instrucciones del ejercicio
- Usa
recipe()para crear un filtro de valores ausentes con un umbral de 0.5. - Aplica
missing_vals_recipeahouse_sales_df.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create missing values recipe
missing_vals_recipe <-
___(___ ~ ., data = ___) %>%
___(___(), ___ = ___) %>%
prep()
# Apply recipe to data
___ <-
___(___, ___ = ___)
# Display the first five rows of data
___ %>% ___(___)