Tabulando valores ausentes
Os resumos de valores ausentes que acabamos de calcular fornecem o número e a porcentagem de observações ausentes para os casos e variáveis.
Outra forma de resumir a ausência de dados é tabulando quantas vezes existem 0, 1, 2, 3 valores ausentes em uma variável ou em um caso.
Neste exercício, vamos tabular a quantidade de valores ausentes em cada caso e variável usando miss_var_table() e miss_case_table(), e também combinar esses resumos com o operador group_by do dplyr para explorar os resumos em relação a uma variável de agrupamento no conjunto de dados.
Este exercício faz parte do curso
Lidando com dados ausentes em R
Instruções do exercício
Para o conjunto de dados airquality:
- Tabule os valores ausentes de cada variável usando
miss_var_table(). - Tabule os valores ausentes de cada caso usando
miss_case_table(). - Combine as tabulações anteriores com a função
group_by()dodplyrpara criar tabulações por variável e caso, em cadaMonth.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Tabulate missingness in each variable and case of the `airquality` dataset
___(airquality)
___(___)
# Tabulate the missingness in each variable, grouped by Month, in the `airquality` dataset
airquality %>% group_by(___) %>% miss_var_table()
# Tabulate of missingness in each case, grouped by Month, in the `airquality` dataset
airquality %>% ___ %>% miss_case_table()