Mendeteksi data teks yang tidak konsisten
Baru-baru ini Anda mendapat kabar bahwa tim dukungan pelanggan ingin menanyakan beberapa pertanyaan lanjutan kepada peserta survei SFO. Namun, sistem panggilan otomatis yang digunakan call center tidak dapat mengurai semua nomor telepon karena formatnya berbeda-beda. Setelah ditelusuri, Anda menemukan bahwa sebagian nomor telepon ditulis dengan tanda hubung (-) dan sebagian lainnya menggunakan tanda kurung ((,)). Pada latihan ini, Anda akan mengetahui nomor telepon mana yang mengalami masalah tersebut sehingga Anda tahu mana yang perlu diperbaiki.
dplyr dan stringr telah dimuat, dan sfo_survey tersedia.
Latihan ini merupakan bagian dari kursus
Membersihkan Data di R
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Filter for rows with "-" in the phone column
sfo_survey %>%
filter(___)