Zusammenstellen
In diesem Kapitel hast du die Spalte city von zagat mit Hilfe von String Similarity bereinigt und Paare von Restaurants aus zagat und fodors erstellt und verglichen. Das Ende ist nah - jetzt musst du nur noch die Paare bewerten und auswählen und die Daten miteinander verknüpfen, dann kannst du im Handumdrehen mit deiner Analyse beginnen!
reclin und dplyr sind geladen und zagat und fodors sind verfügbar.
Diese Übung ist Teil des Kurses
Daten in R bereinigen
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create pairs
pair_blocking(zagat, fodors, blocking_var = "city") %>%
# Compare pairs
compare_pairs(by = c("name", "addr"), default_comparator = jaro_winkler()) %>%
# Score pairs
___