Menggabungkan semuanya
Sepanjang bab ini, Anda telah membersihkan kolom city dari zagat menggunakan kemiripan string, serta menghasilkan dan membandingkan pasangan restoran dari zagat dan fodors. Akhirnya hampir tiba — yang tersisa adalah memberi skor dan memilih pasangan lalu menautkan data tersebut, dan Anda akan siap memulai analisis dalam waktu singkat!
reclin dan dplyr sudah dimuat serta zagat dan fodors tersedia.
Latihan ini adalah bagian dari kursus
Membersihkan Data di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create pairs
pair_blocking(zagat, fodors, blocking_var = "city") %>%
# Compare pairs
compare_pairs(by = c("name", "addr"), default_comparator = jaro_winkler()) %>%
# Score pairs
___