Hepsini bir araya getirelim
Bu bölüm boyunca, zagat veri çerçevesindeki city sütununu dize benzerliğini kullanarak temizledin ve ayrıca zagat ile fodors içinden restoran çiftleri oluşturarak karşılaştırdın. Artık sona çok yaklaştın — geriye sadece çiftleri puanlayıp seçmek ve verileri birbirine bağlamak kaldı; böylece analizine hiç vakit kaybetmeden başlayabilirsin!
reclin ve dplyr yüklü ve zagat ile fodors hazır.
Bu egzersiz
R ile Veri Temizleme
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create pairs
pair_blocking(zagat, fodors, blocking_var = "city") %>%
# Compare pairs
compare_pairs(by = c("name", "addr"), default_comparator = jaro_winkler()) %>%
# Score pairs
___