Eliminar niveles
La tabla de contingencia del ejercicio anterior mostró que hay algunos niveles con recuentos muy bajos. Para simplificar el análisis, a menudo conviene eliminar esos niveles.
En R, esto requiere dos pasos: primero filtrar las filas con los niveles que tienen recuentos muy bajos y después eliminar esos niveles de la variable factor con droplevels(). Esto se debe a que la función droplevels() mantendría niveles que tengan solo 1 o 2 casos; solo elimina los niveles que no existen en el conjunto de datos.
Este ejercicio forma parte del curso
Análisis exploratorio de datos en R
Instrucciones del ejercicio
La tabla de contingencia del ejercicio anterior está disponible en tu espacio de trabajo como tab.
- Carga el paquete
dplyr. - Imprime
tabpara averiguar qué nivel dealigntiene menos entradas en total. - Usa
filter()para filtrar todas las filas decomicscon ese nivel y luego elimina el nivel no utilizado condroplevels(). Guarda el conjunto de datos simplificado comocomics_filtered.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Load dplyr
___
# Print tab
___
# Remove align level
comics_filtered <- ___ %>%
___(align != ___) %>%
___()
# See the result
comics_filtered