Bukan anggota
Sekarang setelah Anda berlatih mengidentifikasi masalah batasan keanggotaan, saatnya memperbaiki masalah tersebut pada himpunan data baru. Sepanjang bab ini, Anda akan bekerja dengan himpunan data bernama sfo_survey, yang berisi tanggapan survei dari penumpang yang terbang dari San Francisco International Airport (SFO). Peserta ditanya tentang kebersihan bandara, waktu tunggu, keamanan, dan kepuasan keseluruhan mereka.
Ada beberapa masalah selama pengumpulan data yang menyebabkan ketidakkonsistenan dalam himpunan data. Dalam latihan ini, Anda akan bekerja dengan kolom dest_size, yang mengategorikan ukuran bandara tujuan tempat penumpang terbang. Sebuah data frame bernama dest_sizes tersedia dan berisi semua kemungkinan ukuran tujuan. Misi Anda adalah menemukan baris dengan dest_size tidak valid dan menghapusnya dari data frame.
dplyr telah dimuat dan sfo_survey serta dest_sizes tersedia.
Latihan ini adalah bagian dari kursus
Membersihkan Data di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Count the number of occurrences of dest_size
sfo_survey %>%
count(___)