ComeçarComece de graça

Visualizar valores imputados em um gráfico de dispersão

Agora, vamos recriar um dos gráficos anteriores que vimos no capítulo três que usava geom_miss_point().

Para isso, precisamos imputar os dados abaixo do intervalo dos dados. Esse é um tipo especial de imputação para explorar o conjunto de dados. Essa imputação vai ilustrar o que precisamos praticar: como rastrear valores ausentes. Para imputar os dados abaixo do intervalo, usamos a função impute_below_all().

Este exercício faz parte do curso

Lidando com dados ausentes em R

Ver curso

Instruções do exercício

Usando os dados oceanbuoys:

  • Impute e rastreie os valores ausentes usando bind_shadow(), impute_below_all() e add_label_shadow().
  • Visualize a ausência de dados em vento e temperatura do ar nos eixos x e y, respectivamente, colorindo os valores ausentes de temperatura do ar com air_temp_c_NA.
  • Visualize umidade e temperatura do ar nos eixos x e y, respectivamente, colorindo quaisquer casos com ausência de dados usando a variável any_missing.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Impute and track the missing values
ocean_imp_track <- bind_shadow(___) %>% 
  impute_below_all() %>% 
  add_label_shadow()

# Visualize the missingness in wind and air temperature,  
# coloring missing air temp values with air_temp_c_NA
ggplot(___, 
       aes(x = ___, y = ___, color = ___)) + 
  geom_point()

# Visualize humidity and air temp, coloring any missing cases using the variable any_missing
ggplot(___, 
       aes(x = ___, y = ___, color = ___)) +  
  geom_point()
Editar e executar o código