MulaiMulai sekarang secara gratis

Mengevaluasi imputasi: Skala

Meskipun imputasi rata-rata mungkin tidak terlihat terlalu buruk saat kita membandingkannya menggunakan box plot, penting untuk memahami variasi dalam data. Inilah sebabnya mengapa penting untuk menelusuri bagaimana skala dan sebaran nilai imputasi berubah dibandingkan dengan data aslinya.

Salah satu cara untuk mengevaluasi kesesuaian skala imputasi adalah menggunakan scatter plot untuk melihat apakah nilai-nilainya tampak sesuai atau tidak.

Latihan ini adalah bagian dari kursus

Menangani Data Hilang di R

Lihat Kursus

Petunjuk latihan

Dengan menggunakan data yang sudah diimputasi, ocean_imp_mean:

  • Telusuri imputasi pada suhu udara (sumbu x) dan kelembapan (sumbu y) menggunakan scatter plot, jangan lupa gunakan color = any_missing.
  • Kembangkan visualisasi sebelumnya dengan membuat facet berdasarkan tahun.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Explore imputations in air temperature and humidity,  
# coloring by the variable, any_missing
ggplot(___, 
       aes(x = ___, y = ___, color = ___)) + 
  geom_point()

# Explore imputations in air temperature and humidity,  
# coloring by the variable, any_missing, and faceting by year
ggplot(___, 
       aes(x = ___, y = ___, color = ___)) + 
  ___() +  
  facet_wrap(~___)
Edit dan Jalankan Kode