Restoran çiftleri
Son derste, bir restoran öneri motoru kurmaya hazır hale getirmek için restaurants veri kümesini temizledin. Modelini eğitmek için yeni bir kaynaktan kazınmış, yeni restoranlar içeren restaurants_new adında yeni bir DataFrame'in var.
Bu kurs boyunca öğrendiğin tekniklerle cuisine_type ve city sütunlarını zaten temizledin. Ancak, restaurants ile basit bir join yerine kayıt bağlama (record linkage) gerektiren, yazım hataları içeren mükerrer restoran adları gördün.
Bu egzersizde, kayıt bağlamanın ilk adımını uygulayacak ve restaurants ile restaurants_new arasında olası satır çiftleri oluşturacaksın. Her iki DataFrame, pandas ve recordlinkage ortamında hazır.
Bu egzersiz
Python ile Veri Temizleme
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create an indexer and object and find possible pairs
indexer = ____
# Block pairing on cuisine_type
indexer.____(____)
# Generate pairs
pairs = indexer.____(____, ____)