Aan de slagGa gratis aan de slag

Alles samenbrengen

In dit hoofdstuk heb je de kolom city van zagat opgeschoond met stringsimilariteit en paren restaurants gegenereerd en vergeleken uit zagat en fodors. Je bent er bijna: nu ga je nog de paren scoren en selecteren en de data aan elkaar koppelen, zodat je meteen met je analyse kunt beginnen!

reclin en dplyr zijn geladen en zagat en fodors zijn beschikbaar.

Deze oefening maakt deel uit van de cursus

Data opschonen in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create pairs
pair_blocking(zagat, fodors, blocking_var = "city") %>%
  # Compare pairs
  compare_pairs(by = c("name", "addr"), default_comparator = jaro_winkler()) %>%
  # Score pairs
  ___
Code bewerken en uitvoeren