Tus primeras visualizaciones de datos faltantes
A veces cuesta identificar dónde están los valores perdidos en tus datos, y aquí la visualización puede ayudarte mucho.
La función vis_miss() crea una visualización general del patrón de ausencia en los datos. También incluye opciones para agrupar filas según los valores perdidos, usando cluster = TRUE; y para ordenar las columnas de mayor a menor cantidad de ausencias (sort_miss = TRUE).
Este ejercicio forma parte del curso
Tratamiento de datos faltantes en R
Instrucciones del ejercicio
Usando el conjunto de datos riskfactors de naniar:
- Usa
vis_miss()para visualizar la ausencia de datos. - Usa
vis_miss()concluster = TRUEpara explorar algunos grupos de ausencia. - Usa
vis_miss()y ordena las ausencias consort_misspara organizar las columnas según la cantidad de valores perdidos.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Visualize all of the missingness in the `riskfactors` dataset
vis_miss(___)
# Visualize and cluster all of the missingness in the `riskfactors` dataset
vis_miss(___, ___ = TRUE)
# visualize and sort the columns by missingness in the `riskfactors` dataset
vis_miss(___, ___ = TRUE)