Blockieren von Paaren
Zagat und Fodor's sind beides Unternehmen, die Restaurantbewertungen sammeln. Die Datensätze zagat
und fodors
enthalten beide Informationen über verschiedene Restaurants, einschließlich Adressen, Telefonnummern und Küchenarten. Einige Restaurants tauchen in beiden Datensätzen auf, haben aber nicht unbedingt denselben Namen oder dieselbe Telefonnummer angegeben. In diesem Kapitel arbeitest du daran, herauszufinden, welche Restaurants in beiden Datensätzen vorkommen.
Der erste Schritt zu diesem Ziel besteht darin, Datensatzpaare zu erstellen, damit du sie vergleichen kannst. In dieser Übung generierst du zunächst alle möglichen Paare und verwendest dann deine neu bereinigte Spalte city
als Blockierungsvariable.
zagat
und fodors
sind verfügbar.
Diese Übung ist Teil des Kurses
Daten in R bereinigen
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Load reclin
___
# Generate all possible pairs
___