Mesin rekomendasi plot
Dalam latihan ini, kita akan membangun mesin rekomendasi yang menyarankan film berdasarkan kemiripan alur cerita. Anda telah disediakan fungsi get_recommendations() yang menerima judul film, matriks kesamaan, dan seri indices sebagai argumennya, lalu menghasilkan daftar film yang paling mirip. indices sudah disediakan untuk Anda.
Anda juga diberikan Series movie_plots yang berisi alur cerita beberapa film. Tugas Anda adalah menghasilkan matriks kesamaan kosinus untuk vektor tf-idf dari alur tersebut.
Selanjutnya, kita akan mengevaluasi kemampuan mesin dengan menghasilkan rekomendasi untuk salah satu film favorit saya, The Dark Knight Rises.
Latihan ini adalah bagian dari kursus
Rekayasa Fitur untuk NLP di Python
Petunjuk latihan
- Inisialisasi
TfidfVectorizerdenganstop_wordsbahasa Inggris. Namai sebagaitfidf. - Bangun
tfidf_matrixdengan melakukan fitting dan transformasi data alur film menggunakanfit_transform(). - Hasilkan matriks kesamaan kosinus
cosine_simmenggunakantfidf_matrix. Jangan gunakancosine_similarity()! - Gunakan
get_recommendations()untuk menghasilkan rekomendasi bagi'The Dark Knight Rises'.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Initialize the TfidfVectorizer
tfidf = ____(____='english')
# Construct the TF-IDF matrix
tfidf_matrix = tfidf.____(movie_plots)
# Generate the cosine similarity matrix
cosine_sim = ____(tfidf_matrix, tfidf_matrix)
# Generate recommendations
print(get_recommendations(____, cosine_sim, indices))