Mencari observasi yang tidak memiliki pasangan
Left join sangat berguna untuk menguji asumsi Anda tentang suatu himpunan data dan memastikan integritas data.
Sebagai contoh, tabel inventories memiliki kolom version, untuk menandai saat sebuah kit LEGO mengalami perubahan atau peningkatan. Wajar bila diasumsikan bahwa semua sets (yang cocok digabungkan dengan inventories) setidaknya memiliki versi 1. Namun, mari kita uji asumsi ini dalam latihan berikut.
Latihan ini merupakan bagian dari kursus
Menggabungkan Data dengan dplyr
Instruksi latihan
- Gunakan
left_joinuntuk menggabungkansetsdaninventory_version_1menggunakan kolom yang sama di keduanya. filterbaris yang kolomversion-nya bernilaiNAmenggunakanis.na.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
inventory_version_1 <- inventories %>%
filter(version == 1)
# Join versions to sets
sets %>%
___ %>%
# Filter for where version is na
___