Alles samenbrengen
In dit hoofdstuk heb je de kolom city van zagat opgeschoond met stringsimilariteit en paren restaurants gegenereerd en vergeleken uit zagat en fodors. Je bent er bijna: nu ga je nog de paren scoren en selecteren en de data aan elkaar koppelen, zodat je meteen met je analyse kunt beginnen!
reclin en dplyr zijn geladen en zagat en fodors zijn beschikbaar.
Deze oefening maakt deel uit van de cursus
Data opschonen in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create pairs
pair_blocking(zagat, fodors, blocking_var = "city") %>%
# Compare pairs
compare_pairs(by = c("name", "addr"), default_comparator = jaro_winkler()) %>%
# Score pairs
___