ComeçarComece de graça

Avaliando imputações ruins

Para avaliar imputações, ajuda saber como é um resultado ruim. Para explorar isso, vamos ver um método tipicamente ruim: imputar usando o valor médio.

Neste exercício, vamos explorar como funciona o método de imputação pela média usando um box plot, com o conjunto de dados oceanbuoys.

Este exercício faz parte do curso

Lidando com dados ausentes em R

Ver curso

Instruções do exercício

Para o conjunto de dados oceanbuoys:

  • Impute o valor médio com impute_mean_all() e rastreie essas imputações com add_label_shadow().
  • Explore os valores imputados de umidade (humidity) usando um box plot.
  • Explore os valores imputados de temperatura do ar (air_temp_c) usando um box plot.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Impute the mean value and track the imputations 
ocean_imp_mean <- bind_shadow(___) %>% 
  ___() %>% 
  ___()

# Explore the mean values in humidity in the imputed dataset
ggplot(___, 
       aes(x = ___, y = ___)) + 
  geom_boxplot()

# Explore the values in air temperature in the imputed dataset
ggplot(___, 
       aes(x = ___, y = ___)) + 
  geom_boxplot()
Editar e executar o código