MulaiMulai sekarang secara gratis

Imputasi data di bawah rentang dengan data nabular

Kita ingin melacak nilai yang kita imputasi. Jika tidak, akan sangat sulit menilai seberapa baik nilai hasil imputasi tersebut.

Kita akan berlatih melakukan imputasi data dan membuat ulang visualisasi pada rangkaian latihan sebelumnya dengan mengimputasi nilai di bawah rentang data.

Ini adalah cara yang sangat berguna untuk membantu mengeksplorasi pola kehilangan data lebih lanjut, sekaligus menyediakan kerangka kerja untuk mengimputasi nilai hilang.

Pertama, kita akan melakukan imputasi data di bawah rentang menggunakan impute_below_all(), lalu memvisualisasikan datanya. Kita menyadari bahwa meskipun kita dapat melihat di mana nilai hilang berada dalam contoh ini, kita memerlukan cara untuk melacaknya. Pola pemrograman pelacakan data hilang dapat membantu untuk hal ini.

Latihan ini adalah bagian dari kursus

Menangani Data Hilang di R

Lihat Kursus

Petunjuk latihan

Dengan menggunakan data oceanbuoys:

  • Lakukan imputasi di bawah rentang menggunakan impute_below_all().
  • Visualisasikan nilai hilang baru untuk wind_ew pada sumbu-x dan air_temp_c pada sumbu-y.
  • Lakukan imputasi dan pelacakan data dengan bind_shadow(), impute_below_all(), dan add_label_shadow().
  • Tampilkan plot dan periksa nilai hasil imputasi.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Impute the oceanbuoys data below the range using `impute_below`.
ocean_imp <- impute_below_all(___)

# Visualize the new missing values
ggplot(___, 
       aes(x = ___, y = ___)) +  
  geom_point()

# Impute and track data with `bind_shadow`, `impute_below_all`, and `add_label_shadow`
ocean_imp_track <- bind_shadow(___) %>% 
  ___() %>% 
  ___()

# Look at the imputed values
___
Edit dan Jalankan Kode