Öneri yöntemlerini karşılaştırma
Bu derste, bir kullanıcının izlemediği filmlere nasıl puan vereceğini birden fazla yöntemle (basit ortalama puanlar, KNN, matris ayrışımı) tahmin ettin. Bu son egzersizde, ortalama puanlar ile matris ayrışımını, performanslarını ölçmek için mean_squared_error() kullanarak karşılaştıracaksın.
Ortalamalara dayalı tahminler avg_pred_ratings_df olarak, hesaplanmış tahminler ise calc_pred_ratings_df olarak yüklendi.
Gerçek değerler act_ratings_df olarak yüklendi.
Son olarak, mean_squared_error() fonksiyonu senin kullanman için sklearn.metrics içinden içe aktarıldı.
Bu egzersiz, kursun bir parçasıdır
Python ile Öneri Motorları Geliştirme
Egzersiz talimatları
act_ratings_df,avg_pred_ratings_dfvecalc_pred_ratings_dfDataFrame'lerinde 0-20. satırları ve 0-100. sütunları (karşılaştırmak istediğin alanlar) çıkar.- Yalnızca boş olmayan hücreleri hedefleyen bir
actual_valuesDataFrame maskesi oluştur. - İki tahmin ile ground truth değerleri arasındaki ortalama kare hatayı (mean squared error) bul.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Extract the ground truth to compare your predictions against
actual_values = act_ratings_df.____[:20, :100].values
avg_values = avg_pred_ratings_df.____[:20, :100].values
predicted_values = calc_pred_ratings_df.____[:20, :100].values
# Create a mask of actual_values to only look at the non-missing values in the ground truth
mask = ~np.isnan(____)
# Print the performance of both predictions and compare
print(____(____[mask], avg_values[mask], squared=False))
print(____(____[mask], predicted_values[mask], squared=False))