Avaliando imputações: Em muitas variáveis
Até agora, vimos formas de observar variáveis individuais ou pares de variáveis e seus valores imputados. Porém, às vezes você quer olhar para as imputações de muitas variáveis. Para isso, é preciso fazer algum tratamento e reorganização dos dados. Esta lição mostra como realizar essa preparação dos dados, que pode ficar um pouco trabalhosa quando pensamos em seu uso com dados nabular. A função shadow_long() deixa os dados no formato certo para esse tipo de visualização.
Este exercício faz parte do curso
Lidando com dados ausentes em R
Instruções do exercício
- Use
shadow_long()para reunir os dados imputados deocean_imp_mean, focando emhumidityeair_temp_c. - Imprima os dados e inspecione-os.
- Explore as imputações em um histograma usando
geom_histogram(), colocando os valores no eixo x, preenchendo pela condição de ausência e fazendo facet porvariable
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Gather the imputed data
ocean_imp_mean_gather <- shadow_long(___,
___,
___))
# Inspect the data
___
# Explore the imputations in a histogram
ggplot(ocean_imp_mean_gather,
aes(x = value, fill = value_NA)) +
geom_histogram() +
facet_wrap(~variable)