Mesin rekomendasi plot
Dalam latihan ini, kita akan membangun mesin rekomendasi yang menyarankan film berdasarkan kemiripan alur cerita. Anda telah disediakan fungsi get_recommendations() yang menerima judul film, matriks kesamaan, dan seri indices sebagai argumennya, lalu menghasilkan daftar film yang paling mirip. indices sudah disediakan untuk Anda.
Anda juga diberikan Series movie_plots yang berisi alur cerita beberapa film. Tugas Anda adalah menghasilkan matriks kesamaan kosinus untuk vektor tf-idf dari alur tersebut.
Selanjutnya, kita akan mengevaluasi kemampuan mesin dengan menghasilkan rekomendasi untuk salah satu film favorit saya, The Dark Knight Rises.
Latihan ini merupakan bagian dari kursus
Rekayasa Fitur untuk NLP di Python
Instruksi latihan
- Inisialisasi
TfidfVectorizerdenganstop_wordsbahasa Inggris. Namai sebagaitfidf. - Bangun
tfidf_matrixdengan melakukan fitting dan transformasi data alur film menggunakanfit_transform(). - Hasilkan matriks kesamaan kosinus
cosine_simmenggunakantfidf_matrix. Jangan gunakancosine_similarity()! - Gunakan
get_recommendations()untuk menghasilkan rekomendasi bagi'The Dark Knight Rises'.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Initialize the TfidfVectorizer
tfidf = ____(____='english')
# Construct the TF-IDF matrix
tfidf_matrix = tfidf.____(movie_plots)
# Generate the cosine similarity matrix
cosine_sim = ____(tfidf_matrix, tfidf_matrix)
# Generate recommendations
print(get_recommendations(____, cosine_sim, indices))