TF-IDF ile tüm filmlerini karşılaştırma
TF-IDF verilerini kullanılabilir bir formata getirmek için gereken emeği verdikten sonra, şimdi bunu benzerlikleri bulmak ve öneriler üretmek için kullanma zamanı.
Bu kez TF-IDF skorlarını (Boole olmayan, float değerler) kullandığın için, öğeler arasındaki benzerlikleri bulmakta cosine similarity metriğini kullanacaksın. Bu egzersizde, tüm filmlerin cosine benzerliklerinden oluşan bir matris üretecek ve bunu kolay arama yapabilmek için bir DataFrame’de saklayacaksın. Bu sayede filmleri karşılaştırman ve hızlıca öneriler bulman mümkün olacak.
Bir önceki egzersizde oluşturduğun ve her film için bir satır içeren tfidf_df DataFrame’i senin için yüklendi.
Bu egzersiz
Python ile Öneri Motorları Geliştirme
kursunun bir parçasıdırEgzersiz talimatları
- Tüm filmler arasındaki cosine benzerlik ölçümlerini bul ve sonucu
cosine_similarity_arraydeğişkenine ata. cosine_similarity_array'dan, satır ve sütunlarıtfidf_summary_df.indexolacak şekilde bir DataFrame oluştur.- DataFrame’in ilk beş satırını yazdır ve benzerlik skorlarını incele.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import cosine_similarity measure
from sklearn.metrics.pairwise import ____
# Create the array of cosine similarity values
cosine_similarity_array = ____(tfidf_summary_df)
# Wrap the array in a pandas DataFrame
cosine_similarity_df = pd.____(cosine_similarity_array, ____=____.____, ____=____.____)
# Print the top 5 rows of the DataFrame
print(cosine_similarity_df.head())