Quantos valores ausentes existem?
Uma das primeiras coisas que você vai querer verificar em um novo conjunto de dados é se há valores ausentes e quantos são.
Você poderia usar are_na() e contar os valores ausentes, mas a forma mais eficiente de contar ausências é usar a função n_miss(). Ela informa o número total de valores ausentes nos dados.
Em seguida, você pode obter a porcentagem de valores ausentes nos dados com a função pct_miss. Ela informa a porcentagem de valores ausentes nos dados.
Você também pode encontrar o complemento disso — quantos valores completos existem — usando n_complete e pct_complete.
Este exercício faz parte do curso
Lidando com dados ausentes em R
Instruções do exercício
Usando o dataframe de exemplo com alturas e pesos, dat_hw:
- Use
n_miss()no dataframedat_hwpara contar o número total de valores ausentes no dataframe. - Use
n_miss()na variáveldat_hw$weightpara contar o número total de valores ausentes nela. - Da mesma forma, use
prop_miss(),n_complete(), eprop_complete()para obter a proporção de ausências e o número e a proporção de valores completos para o dataframe e para as variáveis.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Use n_miss() to count the total number of missing values in dat_hw
n_miss(___)
# Use n_miss() on dat_hw$weight to count the total number of missing values
n_miss(___$___)
# Use n_complete() on dat_hw to count the total number of complete values
n_complete(___)
# Use n_complete() on dat_hw$weight to count the total number of complete values
___(___$___)
# Use prop_miss() and prop_complete() on dat_hw to count the total number of missing values in each of the variables
prop_miss(____)
prop_complete(___)