MulaiMulai sekarang secara gratis

Pasangan restoran

Pada pelajaran sebelumnya, Anda telah membersihkan himpunan data restaurants agar siap digunakan untuk membangun mesin rekomendasi restoran. Anda memiliki DataFrame baru bernama restaurants_new berisi restoran baru untuk melatih model Anda, yang diambil dari sumber data baru.

Anda sudah membersihkan kolom cuisine_type dan city menggunakan teknik yang dipelajari sepanjang kursus. Namun, Anda menemukan duplikasi dengan salah ketik pada nama restoran yang memerlukan record linkage alih-alih melakukan join dengan restaurants.

Dalam latihan ini, Anda akan melakukan langkah pertama dalam record linkage dan menghasilkan pasangan baris yang mungkin antara restaurants dan restaurants_new. Kedua DataFrame, pandas, dan recordlinkage sudah tersedia di lingkungan Anda.

Latihan ini adalah bagian dari kursus

Membersihkan Data di Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create an indexer and object and find possible pairs
indexer = ____

# Block pairing on cuisine_type
indexer.____(____)

# Generate pairs
pairs = indexer.____(____, ____)
Edit dan Jalankan Kode