Satırlarındaki sınırlı veri
Gerçek dünyadaki bu seyrek veri, geçen bölümde tartışıldığı gibi K-en yakın komşular (KNN) gibi teknikleri kullanırken sorun yaratabilir. KNN, bir öğeye puan veren en benzer k kullanıcıyı bulmak zorundadır; ancak bir öğeye k veya daha az kullanıcı puan verdiyse, tüm puanlar "en benzer" olacaktır.
Bu egzersizde, user_ratings_df DataFrame'indeki her filmin kaç kez puanlandığını sayacak ve ardından yalnızca bir veya iki puana sahip kaç film olduğunu göreceksin.
Bu egzersiz
Python ile Öneri Motorları Geliştirme
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Count the occupied cells per column
occupied_count = user_ratings_df.____().____()
print(occupied_count)