Imputar dados abaixo do intervalo com dados nabulares
Queremos acompanhar os valores que imputamos. Se não fizermos isso, fica muito difícil avaliar quão bons são os valores imputados.
Vamos praticar a imputação de dados e recriar visualizações do conjunto de exercícios anterior, imputando valores abaixo do intervalo dos dados.
Essa é uma forma muito útil de explorar melhor a ausência de dados e também fornece a base para imputar valores ausentes.
Primeiro, vamos imputar os dados abaixo do intervalo usando impute_below_all(), e depois visualizar os dados. Percebemos que, embora consigamos ver onde estão os valores ausentes neste caso, precisamos de alguma forma de rastreá-los. O padrão de programação para rastrear dados ausentes pode ajudar com isso.
Este exercício faz parte do curso
Lidando com dados ausentes em R
Instruções do exercício
Usando os dados oceanbuoys:
- Impute abaixo do intervalo usando
impute_below_all(). - Visualize os novos valores ausentes com
wind_ewno eixo x eair_temp_cno eixo y. - Impute e rastreie os dados com
bind_shadow(),impute_below_all()eadd_label_shadow(). - Mostre o gráfico e inspecione os valores imputados.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Impute the oceanbuoys data below the range using `impute_below`.
ocean_imp <- impute_below_all(___)
# Visualize the new missing values
ggplot(___,
aes(x = ___, y = ___)) +
geom_point()
# Impute and track data with `bind_shadow`, `impute_below_all`, and `add_label_shadow`
ocean_imp_track <- bind_shadow(___) %>%
___() %>%
___()
# Look at the imputed values
___