BaşlayınÜcretsiz Başlayın

Kategorileri yeniden eşleme II

Son egzersizde, cuisine_type sütununda saklanan 'american', 'asian' ve 'italian' mutfak türlerindeki yazım hatalarını yeniden eşlemek için mesafe eşik noktasının 80 olması gerektiğini belirlemiştin.

Bu egzersizde, her bir doğru mutfak türü için fuzywuzzy.process'un extract() fonksiyonunu kullanarak benzerlik puanı 80'e eşit veya daha yüksek olan eşleşmeleri bularak hepsini bir araya getireceksin ve bu eşleşmeleri doğru değerle değiştireceksin. Unutma, process.extract() ile bir string'i string dizisiyle karşılaştırdığında çıktı, her biri şu şekilde biçimlendirilmiş demetlerden oluşan bir listedir:

(en yakın eşleşme, benzerlik puanı, eşleşmenin indeksi)

restaurants DataFrame'i çalışma alanında mevcut ve doğru mutfak türlerini ('italian', 'asian' ve 'american') içeren bir categories listesine erişimin var.

Bu egzersiz

Python ile Veri Temizleme

kursunun bir parçasıdır
Kursu Görüntüle

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Inspect the unique values of the cuisine_type column
print(____)
Kodu Düzenle ve Çalıştır