Mencari observasi yang tidak memiliki pasangan
Left join sangat berguna untuk menguji asumsi Anda tentang suatu himpunan data dan memastikan integritas data.
Sebagai contoh, tabel inventories memiliki kolom version, untuk menandai saat sebuah kit LEGO mengalami perubahan atau peningkatan. Wajar bila diasumsikan bahwa semua sets (yang cocok digabungkan dengan inventories) setidaknya memiliki versi 1. Namun, mari kita uji asumsi ini dalam latihan berikut.
Latihan ini adalah bagian dari kursus
Menggabungkan Data dengan dplyr
Petunjuk latihan
- Gunakan
left_joinuntuk menggabungkansetsdaninventory_version_1menggunakan kolom yang sama di keduanya. filterbaris yang kolomversion-nya bernilaiNAmenggunakanis.na.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
inventory_version_1 <- inventories %>%
filter(version == 1)
# Join versions to sets
sets %>%
___ %>%
# Filter for where version is na
___