Suas primeiras visualizações de dados ausentes
Pode ser difícil entender onde estão os valores ausentes no seu conjunto de dados, e é aí que a visualização realmente ajuda.
A função vis_miss() cria uma visualização geral da ausência de dados. Ela também tem opções para agrupar linhas com base na ausência, usando cluster = TRUE; e opções para ordenar as colunas, da que tem mais ausentes para a que tem menos (sort_miss = TRUE).
Este exercício faz parte do curso
Lidando com dados ausentes em R
Instruções do exercício
Usando o conjunto de dados riskfactors do naniar:
- Use
vis_miss()para visualizar a ausência de dados. - Use
vis_miss()comcluster = TRUEpara explorar alguns agrupamentos de ausência. - Use
vis_miss()e ordene os ausentes comsort_misspara organizar as colunas por ausência.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Visualize all of the missingness in the `riskfactors` dataset
vis_miss(___)
# Visualize and cluster all of the missingness in the `riskfactors` dataset
vis_miss(___, ___ = TRUE)
# visualize and sort the columns by missingness in the `riskfactors` dataset
vis_miss(___, ___ = TRUE)