MulaiMulai sekarang secara gratis

Mesin rekomendasi plot

Dalam latihan ini, kita akan membangun mesin rekomendasi yang menyarankan film berdasarkan kemiripan alur cerita. Anda telah disediakan fungsi get_recommendations() yang menerima judul film, matriks kesamaan, dan seri indices sebagai argumennya, lalu menghasilkan daftar film yang paling mirip. indices sudah disediakan untuk Anda.

Anda juga diberikan Series movie_plots yang berisi alur cerita beberapa film. Tugas Anda adalah menghasilkan matriks kesamaan kosinus untuk vektor tf-idf dari alur tersebut.

Selanjutnya, kita akan mengevaluasi kemampuan mesin dengan menghasilkan rekomendasi untuk salah satu film favorit saya, The Dark Knight Rises.

Latihan ini adalah bagian dari kursus

Rekayasa Fitur untuk NLP di Python

Lihat Kursus

Petunjuk latihan

  • Inisialisasi TfidfVectorizer dengan stop_words bahasa Inggris. Namai sebagai tfidf.
  • Bangun tfidf_matrix dengan melakukan fitting dan transformasi data alur film menggunakan fit_transform().
  • Hasilkan matriks kesamaan kosinus cosine_sim menggunakan tfidf_matrix. Jangan gunakan cosine_similarity()!
  • Gunakan get_recommendations() untuk menghasilkan rekomendasi bagi 'The Dark Knight Rises'.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Initialize the TfidfVectorizer 
tfidf = ____(____='english')

# Construct the TF-IDF matrix
tfidf_matrix = tfidf.____(movie_plots)

# Generate the cosine similarity matrix
cosine_sim = ____(tfidf_matrix, tfidf_matrix)
 
# Generate recommendations 
print(get_recommendations(____, cosine_sim, indices))
Edit dan Jalankan Kode