Konu özeti öneri motoru
Bu egzersizde, konu özetlerinin benzerliğine göre filmler öneren bir öneri motoru kuracağız. Sana, bir filmi adıyla alan, bir benzerlik matrisi ve argüman olarak bir de indices serisi kabul eden ve en benzer filmleri listeleyen bir get_recommendations() fonksiyonu verildi. indices zaten sağlandı.
Ayrıca, çeşitli filmlerin konu özetlerini içeren bir movie_plots Serisi de verildi. Görevin, bu özetlerin tf-idf vektörleri için bir kosinüs benzerliği matrisi üretmek.
Sonrasında, en sevdiğim filmlerden biri olan The Dark Knight Rises için öneriler oluşturarak motorumuzun gücünü test edeceğiz.
Bu egzersiz, kursun bir parçasıdır
Python ile NLP için Özellik Mühendisliği
Egzersiz talimatları
- İngilizce
stop_wordsile birTfidfVectorizerbaşlat. Adıtfidfolsun. fit_transform()kullanarak film konu özeti verisini fit edip dönüştürerektfidf_matrix'i oluştur.tfidf_matrix'i kullanarak kosinüs benzerliği matrisicosine_simüret.cosine_similarity()kullanma!'The Dark Knight Rises'için öneriler üretmek üzereget_recommendations()fonksiyonunu kullan.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Initialize the TfidfVectorizer
tfidf = ____(____='english')
# Construct the TF-IDF matrix
tfidf_matrix = tfidf.____(movie_plots)
# Generate the cosine similarity matrix
cosine_sim = ____(tfidf_matrix, tfidf_matrix)
# Generate recommendations
print(get_recommendations(____, cosine_sim, indices))