Avaliando imputações ruins
Para avaliar imputações, ajuda saber como é um resultado ruim. Para explorar isso, vamos ver um método tipicamente ruim: imputar usando o valor médio.
Neste exercício, vamos explorar como funciona o método de imputação pela média usando um box plot, com o conjunto de dados oceanbuoys.
Este exercício faz parte do curso
Lidando com dados ausentes em R
Instruções do exercício
Para o conjunto de dados oceanbuoys:
- Impute o valor médio com
impute_mean_all()e rastreie essas imputações comadd_label_shadow(). - Explore os valores imputados de umidade (
humidity) usando um box plot. - Explore os valores imputados de temperatura do ar (
air_temp_c) usando um box plot.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Impute the mean value and track the imputations
ocean_imp_mean <- bind_shadow(___) %>%
___() %>%
___()
# Explore the mean values in humidity in the imputed dataset
ggplot(___,
aes(x = ___, y = ___)) +
geom_boxplot()
# Explore the values in air temperature in the imputed dataset
ggplot(___,
aes(x = ___, y = ___)) +
geom_boxplot()