Erste SchritteKostenlos loslegen

Blockieren von Paaren

Zagat und Fodor's sind beides Unternehmen, die Restaurantbewertungen sammeln. Die Datensätze zagat und fodors enthalten beide Informationen über verschiedene Restaurants, einschließlich Adressen, Telefonnummern und Küchenarten. Einige Restaurants tauchen in beiden Datensätzen auf, haben aber nicht unbedingt denselben Namen oder dieselbe Telefonnummer angegeben. In diesem Kapitel arbeitest du daran, herauszufinden, welche Restaurants in beiden Datensätzen vorkommen.

Der erste Schritt zu diesem Ziel besteht darin, Datensatzpaare zu erstellen, damit du sie vergleichen kannst. In dieser Übung generierst du zunächst alle möglichen Paare und verwendest dann deine neu bereinigte Spalte city als Blockierungsvariable.

zagat und fodors sind verfügbar.

Diese Übung ist Teil des Kurses

Daten in R bereinigen

Kurs anzeigen

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Load reclin
___

# Generate all possible pairs
___
Bearbeiten und Ausführen von Code