MulaiMulai sekarang secara gratis

Membuat data matriks bayangan (shadow matrix)

Data hilang bisa sulit dipahami karena biasanya tidak menampakkan diri secara jelas, melainkan tersembunyi di antara data.

Salah satu cara untuk menyingkap nilai yang hilang adalah dengan mengubah cara kita memandang data—dengan mempertimbangkan setiap nilai data apakah hilang atau tidak hilang.

Fungsi as_shadow() di R mengubah sebuah dataframe menjadi shadow matrix, yaitu format data khusus di mana nilainya hanya dua kemungkinan: hilang (NA) atau tidak hilang (!NA).

Nama kolom pada shadow matrix sama dengan data aslinya, tetapi ditambahkan sufiks _NA.

Untuk melacak dan membandingkan nilai data dengan status kelengkapannya, gunakan fungsi bind_shadow(). Data dalam format ini—yakni kolom shadow matrix digabungkan dengan data biasa—disebut data nabular.

Latihan ini adalah bagian dari kursus

Menangani Data Hilang di R

Lihat Kursus

Petunjuk latihan

Dengan menggunakan himpunan data oceanbuoys:

  • Buat data shadow matrix dengan as_shadow()
  • Buat data nabular dengan menggabungkan shadow ke data menggunakan bind_shadow()
  • Gabungkan hanya variabel yang memiliki nilai hilang dengan menggunakan bind_shadow(only_miss = TRUE)

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create shadow matrix data with `as_shadow()`
___(___)

# Create nabular data by binding the shadow to the data with `bind_shadow()`
___(___)

# Bind only the variables with missing values by using bind_shadow(only_miss = TRUE)
___(___, ___ = TRUE)
Edit dan Jalankan Kode