Ähnliche Restaurants
In der letzten Übung hast du Paare zwischen restaurants
und restaurants_new
erstellt, um die beiden DataFrames mithilfe der Datensatzverknüpfung sauber zusammenzuführen.
Bei der Datensatzverknüpfung gibt es verschiedene Arten von Übereinstimmungen, die du zwischen den verschiedenen Spalten deines DataFrame durchführen kannst, z. B. exakte Übereinstimmungen, Zeichenkettenähnlichkeiten und mehr.
Nachdem deine Paare erstellt und in pairs
gespeichert wurden, findest du in den Spalten city
und cuisine_type
exakte Übereinstimmungen zwischen jedem Paar und in der Spalte rest_name
ähnliche Zeichenketten für jedes Paar. Beide DataFrames, pandas
und recordlinkage
befinden sich in deiner Umgebung.
Diese Übung ist Teil des Kurses
Datenbereinigung in Python
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Create a comparison object
comp_cl = ____