ComeçarComece de graça

Avaliando imputações: Em muitas variáveis

Até agora, vimos formas de observar variáveis individuais ou pares de variáveis e seus valores imputados. Porém, às vezes você quer olhar para as imputações de muitas variáveis. Para isso, é preciso fazer algum tratamento e reorganização dos dados. Esta lição mostra como realizar essa preparação dos dados, que pode ficar um pouco trabalhosa quando pensamos em seu uso com dados nabular. A função shadow_long() deixa os dados no formato certo para esse tipo de visualização.

Este exercício faz parte do curso

Lidando com dados ausentes em R

Ver curso

Instruções do exercício

  • Use shadow_long() para reunir os dados imputados de ocean_imp_mean, focando em humidity e air_temp_c.
  • Imprima os dados e inspecione-os.
  • Explore as imputações em um histograma usando geom_histogram(), colocando os valores no eixo x, preenchendo pela condição de ausência e fazendo facet por variable

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Gather the imputed data 
ocean_imp_mean_gather <- shadow_long(___,
                                     ___,
                                     ___))
# Inspect the data
___

# Explore the imputations in a histogram 
ggplot(ocean_imp_mean_gather, 
       aes(x = value, fill = value_NA)) + 
  geom_histogram() + 
  facet_wrap(~variable)
Editar e executar o código