Membuat data matriks bayangan (shadow matrix)
Data hilang bisa sulit dipahami karena biasanya tidak menampakkan diri secara jelas, melainkan tersembunyi di antara data.
Salah satu cara untuk menyingkap nilai yang hilang adalah dengan mengubah cara kita memandang data—dengan mempertimbangkan setiap nilai data apakah hilang atau tidak hilang.
Fungsi as_shadow() di R mengubah sebuah dataframe menjadi shadow matrix, yaitu format data khusus di mana nilainya hanya dua kemungkinan: hilang (NA) atau tidak hilang (!NA).
Nama kolom pada shadow matrix sama dengan data aslinya, tetapi ditambahkan sufiks _NA.
Untuk melacak dan membandingkan nilai data dengan status kelengkapannya, gunakan fungsi bind_shadow(). Data dalam format ini—yakni kolom shadow matrix digabungkan dengan data biasa—disebut data nabular.
Latihan ini adalah bagian dari kursus
Menangani Data Hilang di R
Petunjuk latihan
Dengan menggunakan himpunan data oceanbuoys:
- Buat data shadow matrix dengan
as_shadow() - Buat data nabular dengan menggabungkan shadow ke data menggunakan
bind_shadow() - Gabungkan hanya variabel yang memiliki nilai hilang dengan menggunakan
bind_shadow(only_miss = TRUE)
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create shadow matrix data with `as_shadow()`
___(___)
# Create nabular data by binding the shadow to the data with `bind_shadow()`
___(___)
# Bind only the variables with missing values by using bind_shadow(only_miss = TRUE)
___(___, ___ = TRUE)