Zusammenstellen
In diesem Kapitel hast du die Spalte city
von zagat
mit Hilfe von String Similarity bereinigt und Paare von Restaurants aus zagat
und fodors
erstellt und verglichen. Das Ende ist nah - jetzt musst du nur noch die Paare bewerten und auswählen und die Daten miteinander verknüpfen, dann kannst du im Handumdrehen mit deiner Analyse beginnen!
reclin
und dplyr
sind geladen und zagat
und fodors
sind verfügbar.
Diese Übung ist Teil des Kurses
Daten in R bereinigen
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Create pairs
pair_blocking(zagat, fodors, blocking_var = "city") %>%
# Compare pairs
compare_pairs(by = c("name", "addr"), default_comparator = jaro_winkler()) %>%
# Score pairs
___