ComeçarComece de graça

Quantos valores ausentes existem?

Uma das primeiras coisas que você vai querer verificar em um novo conjunto de dados é se há valores ausentes e quantos são.

Você poderia usar are_na() e contar os valores ausentes, mas a forma mais eficiente de contar ausências é usar a função n_miss(). Ela informa o número total de valores ausentes nos dados.

Em seguida, você pode obter a porcentagem de valores ausentes nos dados com a função pct_miss. Ela informa a porcentagem de valores ausentes nos dados.

Você também pode encontrar o complemento disso — quantos valores completos existem — usando n_complete e pct_complete.

Este exercício faz parte do curso

Lidando com dados ausentes em R

Ver curso

Instruções do exercício

Usando o dataframe de exemplo com alturas e pesos, dat_hw:

  • Use n_miss() no dataframe dat_hw para contar o número total de valores ausentes no dataframe.
  • Use n_miss() na variável dat_hw$weight para contar o número total de valores ausentes nela.
  • Da mesma forma, use prop_miss(), n_complete(), e prop_complete() para obter a proporção de ausências e o número e a proporção de valores completos para o dataframe e para as variáveis.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Use n_miss() to count the total number of missing values in dat_hw
n_miss(___)

# Use n_miss() on dat_hw$weight to count the total number of missing values
n_miss(___$___)

# Use n_complete() on dat_hw to count the total number of complete values
n_complete(___)

# Use n_complete() on dat_hw$weight to count the total number of complete values
___(___$___)

# Use prop_miss() and prop_complete() on dat_hw to count the total number of missing values in each of the variables
prop_miss(____)
prop_complete(___)
Editar e executar o código