LoslegenKostenlos loslegen

Alles zusammenführen

In diesem Kapitel hast du die Spalte city von zagat mithilfe von Zeichenkettenähnlichkeit bereinigt und außerdem Paare von Restaurants aus zagat und fodors erzeugt und verglichen. Das Ende ist nah – es fehlt nur noch, die Paare zu bewerten und auszuwählen und die Daten zu verknüpfen. Dann kannst du im Handumdrehen mit deiner Analyse starten!

reclin und dplyr sind geladen und zagat sowie fodors sind verfügbar.

Diese Übung ist Teil des Kurses

Datenbereinigung in R

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create pairs
pair_blocking(zagat, fodors, blocking_var = "city") %>%
  # Compare pairs
  compare_pairs(by = c("name", "addr"), default_comparator = jaro_winkler()) %>%
  # Score pairs
  ___
Code bearbeiten und ausführen