ComeçarComece de graça

Imputar dados abaixo do intervalo com dados nabulares

Queremos acompanhar os valores que imputamos. Se não fizermos isso, fica muito difícil avaliar quão bons são os valores imputados.

Vamos praticar a imputação de dados e recriar visualizações do conjunto de exercícios anterior, imputando valores abaixo do intervalo dos dados.

Essa é uma forma muito útil de explorar melhor a ausência de dados e também fornece a base para imputar valores ausentes.

Primeiro, vamos imputar os dados abaixo do intervalo usando impute_below_all(), e depois visualizar os dados. Percebemos que, embora consigamos ver onde estão os valores ausentes neste caso, precisamos de alguma forma de rastreá-los. O padrão de programação para rastrear dados ausentes pode ajudar com isso.

Este exercício faz parte do curso

Lidando com dados ausentes em R

Ver curso

Instruções do exercício

Usando os dados oceanbuoys:

  • Impute abaixo do intervalo usando impute_below_all().
  • Visualize os novos valores ausentes com wind_ew no eixo x e air_temp_c no eixo y.
  • Impute e rastreie os dados com bind_shadow(), impute_below_all() e add_label_shadow().
  • Mostre o gráfico e inspecione os valores imputados.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Impute the oceanbuoys data below the range using `impute_below`.
ocean_imp <- impute_below_all(___)

# Visualize the new missing values
ggplot(___, 
       aes(x = ___, y = ___)) +  
  geom_point()

# Impute and track data with `bind_shadow`, `impute_below_all`, and `add_label_shadow`
ocean_imp_track <- bind_shadow(___) %>% 
  ___() %>% 
  ___()

# Look at the imputed values
___
Editar e executar o código