Mendeteksi data teks yang tidak konsisten
Baru-baru ini Anda mendapat kabar bahwa tim dukungan pelanggan ingin menanyakan beberapa pertanyaan lanjutan kepada peserta survei SFO. Namun, sistem panggilan otomatis yang digunakan call center tidak dapat mengurai semua nomor telepon karena formatnya berbeda-beda. Setelah ditelusuri, Anda menemukan bahwa sebagian nomor telepon ditulis dengan tanda hubung (-) dan sebagian lainnya menggunakan tanda kurung ((,)). Pada latihan ini, Anda akan mengetahui nomor telepon mana yang mengalami masalah tersebut sehingga Anda tahu mana yang perlu diperbaiki.
dplyr dan stringr telah dimuat, dan sfo_survey tersedia.
Latihan ini adalah bagian dari kursus
Membersihkan Data di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Filter for rows with "-" in the phone column
sfo_survey %>%
filter(___)