MulaiMulai sekarang secara gratis

Pemetaan ulang kategori II

Pada latihan sebelumnya, Anda menentukan bahwa titik batas jarak untuk memetakan ulang salah ketik pada jenis masakan 'american', 'asian', dan 'italian' yang tersimpan di kolom cuisine_type adalah 80.

Dalam latihan ini, Anda akan menggabungkan semuanya dengan mencari kecocokan dengan skor kemiripan sama dengan atau lebih tinggi dari 80 menggunakan fungsi extract() dari fuzywuzzy.process, untuk setiap jenis masakan yang benar, lalu menggantikan kecocokan tersebut dengan nilai yang benar. Ingat, saat membandingkan sebuah string dengan sebuah array string menggunakan process.extract(), keluarannya adalah daftar tuple dengan format:

(closest match, similarity score, index of match)

DataFrame restaurants sudah tersedia di lingkungan Anda, dan Anda juga memiliki daftar categories yang berisi jenis masakan yang benar ('italian', 'asian', dan 'american').

Latihan ini adalah bagian dari kursus

Membersihkan Data di Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Inspect the unique values of the cuisine_type column
print(____)
Edit dan Jalankan Kode