Hepsini bir araya getirelim
Bu bölüm boyunca, zagat veri çerçevesindeki city sütununu dize benzerliğini kullanarak temizledin ve ayrıca zagat ile fodors içinden restoran çiftleri oluşturarak karşılaştırdın. Artık sona çok yaklaştın — geriye sadece çiftleri puanlayıp seçmek ve verileri birbirine bağlamak kaldı; böylece analizine hiç vakit kaybetmeden başlayabilirsin!
reclin ve dplyr yüklü ve zagat ile fodors hazır.
Bu egzersiz, kursun bir parçasıdır
R ile Veri Temizleme
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Create pairs
pair_blocking(zagat, fodors, blocking_var = "city") %>%
# Compare pairs
compare_pairs(by = c("name", "addr"), default_comparator = jaro_winkler()) %>%
# Score pairs
___