BaşlayınÜcretsiz başlayın

Kategorileri yeniden eşleme II

Son egzersizde, cuisine_type sütununda saklanan 'american', 'asian' ve 'italian' mutfak türlerindeki yazım hatalarını yeniden eşlemek için mesafe eşik noktasının 80 olması gerektiğini belirlemiştin.

Bu egzersizde, her bir doğru mutfak türü için fuzywuzzy.process'un extract() fonksiyonunu kullanarak benzerlik puanı 80'e eşit veya daha yüksek olan eşleşmeleri bularak hepsini bir araya getireceksin ve bu eşleşmeleri doğru değerle değiştireceksin. Unutma, process.extract() ile bir string'i string dizisiyle karşılaştırdığında çıktı, her biri şu şekilde biçimlendirilmiş demetlerden oluşan bir listedir:

(en yakın eşleşme, benzerlik puanı, eşleşmenin indeksi)

restaurants DataFrame'i çalışma alanında mevcut ve doğru mutfak türlerini ('italian', 'asian' ve 'american') içeren bir categories listesine erişimin var.

Bu egzersiz, kursun bir parçasıdır

Python ile Veri Temizleme

Kursa Göz Atın

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Inspect the unique values of the cuisine_type column
print(____)
Kodu Düzenle ve Çalıştır