Visualizar valores imputados em um gráfico de dispersão
Agora, vamos recriar um dos gráficos anteriores que vimos no capítulo três que usava geom_miss_point().
Para isso, precisamos imputar os dados abaixo do intervalo dos dados. Esse é um tipo especial de imputação para explorar o conjunto de dados. Essa imputação vai ilustrar o que precisamos praticar: como rastrear valores ausentes. Para imputar os dados abaixo do intervalo, usamos a função impute_below_all().
Este exercício faz parte do curso
Lidando com dados ausentes em R
Instruções do exercício
Usando os dados oceanbuoys:
- Impute e rastreie os valores ausentes usando
bind_shadow(),impute_below_all()eadd_label_shadow(). - Visualize a ausência de dados em vento e temperatura do ar nos eixos x e y, respectivamente, colorindo os valores ausentes de temperatura do ar com
air_temp_c_NA. - Visualize umidade e temperatura do ar nos eixos x e y, respectivamente, colorindo quaisquer casos com ausência de dados usando a variável
any_missing.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Impute and track the missing values
ocean_imp_track <- bind_shadow(___) %>%
impute_below_all() %>%
add_label_shadow()
# Visualize the missingness in wind and air temperature,
# coloring missing air temp values with air_temp_c_NA
ggplot(___,
aes(x = ___, y = ___, color = ___)) +
geom_point()
# Visualize humidity and air temp, coloring any missing cases using the variable any_missing
ggplot(___,
aes(x = ___, y = ___, color = ___)) +
geom_point()