Alles zusammenführen
In diesem Kapitel hast du die Spalte city von zagat mithilfe von Zeichenkettenähnlichkeit bereinigt und außerdem Paare von Restaurants aus zagat und fodors erzeugt und verglichen. Das Ende ist nah – es fehlt nur noch, die Paare zu bewerten und auszuwählen und die Daten zu verknüpfen. Dann kannst du im Handumdrehen mit deiner Analyse starten!
reclin und dplyr sind geladen und zagat sowie fodors sind verfügbar.
Diese Übung ist Teil des Kurses
Datenbereinigung in R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create pairs
pair_blocking(zagat, fodors, blocking_var = "city") %>%
# Compare pairs
compare_pairs(by = c("name", "addr"), default_comparator = jaro_winkler()) %>%
# Score pairs
___