Alles zusammenführen
In diesem Kapitel hast du die Spalte city von zagat mithilfe von Zeichenkettenähnlichkeit bereinigt und außerdem Paare von Restaurants aus zagat und fodors erzeugt und verglichen. Das Ende ist nah – es fehlt nur noch, die Paare zu bewerten und auszuwählen und die Daten zu verknüpfen. Dann kannst du im Handumdrehen mit deiner Analyse starten!
reclin und dplyr sind geladen und zagat sowie fodors sind verfügbar.
Diese Übung ist Teil des Kurses
<Kurs>Datenbereinigung in R</Kurs>Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create pairs
pair_blocking(zagat, fodors, blocking_var = "city") %>%
# Compare pairs
compare_pairs(by = c("name", "addr"), default_comparator = jaro_winkler()) %>%
# Score pairs
___