LoslegenKostenlos starten

Alles zusammenführen

In diesem Kapitel hast du die Spalte city von zagat mithilfe von Zeichenkettenähnlichkeit bereinigt und außerdem Paare von Restaurants aus zagat und fodors erzeugt und verglichen. Das Ende ist nah – es fehlt nur noch, die Paare zu bewerten und auszuwählen und die Daten zu verknüpfen. Dann kannst du im Handumdrehen mit deiner Analyse starten!

reclin und dplyr sind geladen und zagat sowie fodors sind verfügbar.

Diese Übung ist Teil des Kurses

<Kurs>Datenbereinigung in R</Kurs>
Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create pairs
pair_blocking(zagat, fodors, blocking_var = "city") %>%
  # Compare pairs
  compare_pairs(by = c("name", "addr"), default_comparator = jaro_winkler()) %>%
  # Score pairs
  ___
Code bearbeiten und ausführen