Tabulación de valores ausentes
Los resúmenes de ausencia que acabamos de calcular nos dan el número y el porcentaje de observaciones ausentes para los casos y las variables.
Otra forma de resumir la ausencia es tabulando cuántas veces hay 0, 1, 2, 3 ausentes en una variable o en un caso.
En este ejercicio vamos a tabular el número de ausentes en cada caso y variable usando miss_var_table() y miss_case_table(), y también combinaremos estos resúmenes con el operador group_by de dplyr para explorar los resúmenes sobre una variable de agrupación del conjunto de datos.
Este ejercicio forma parte del curso
Tratamiento de datos faltantes en R
Instrucciones del ejercicio
Para el conjunto de datos airquality:
- Tabula los valores ausentes de cada variable usando
miss_var_table(). - Tabula los valores ausentes de cada caso usando
miss_case_table(). - Combina las tabulaciones anteriores con la función
group_by()dedplyrpara crear tabulaciones por variable y por caso, para cadaMonth.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Tabulate missingness in each variable and case of the `airquality` dataset
___(airquality)
___(___)
# Tabulate the missingness in each variable, grouped by Month, in the `airquality` dataset
airquality %>% group_by(___) %>% miss_var_table()
# Tabulate of missingness in each case, grouped by Month, in the `airquality` dataset
airquality %>% ___ %>% miss_case_table()