Memperbaiki salah ketik dengan jarak string
Dalam bab ini, salah satu himpunan data yang akan Anda gunakan, zagat, berisi daftar restoran di New York, Los Angeles, Atlanta, San Francisco, dan Las Vegas. Data ini berasal dari Zagat, sebuah perusahaan yang mengumpulkan ulasan restoran, dan mencakup nama restoran, alamat, nomor telepon, serta informasi restoran lainnya.
Kolom city memuat nama kota tempat restoran berada. Namun, terdapat sejumlah salah ketik di seluruh kolom tersebut. Tugas Anda adalah memetakan setiap city ke salah satu dari lima nama kota yang ejaannya benar yang terdapat dalam data frame cities.
dplyr dan fuzzyjoin sudah dimuat, serta zagat dan cities tersedia.
Latihan ini adalah bagian dari kursus
Membersihkan Data di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Count the number of each city variation
zagat %>%
count(___)