MulaiMulai sekarang secara gratis

Rekomendasi TED Talk

Dalam latihan ini, kita akan membangun sistem rekomendasi yang menyarankan TED Talk berdasarkan transkripnya. Anda telah diberikan fungsi get_recommendations() yang menerima judul sebuah talk, sebuah matriks kesamaan, dan sebuah series indices sebagai argumen, lalu menghasilkan daftar talk yang paling mirip. indices telah disediakan untuk Anda.

Anda juga diberikan sebuah series transcripts yang berisi transkrip sekitar 500 TED Talk. Tugas Anda adalah menghasilkan matriks kesamaan kosinus untuk vektor tf-idf dari transkrip talk tersebut.

Selanjutnya, kita akan menghasilkan rekomendasi untuk talk berjudul '5 ways to kill your dreams' oleh wirausahawan Brasil, Bel Pesce.

Latihan ini adalah bagian dari kursus

Rekayasa Fitur untuk NLP di Python

Lihat Kursus

Petunjuk latihan

  • Inisialisasi TfidfVectorizer dengan stopwords bahasa Inggris. Beri nama tfidf.
  • Bangun tfidf_matrix dengan melakukan fit dan transform pada transcripts.
  • Hasilkan matriks kesamaan kosinus cosine_sim menggunakan tfidf_matrix.
  • Gunakan get_recommendations() untuk menghasilkan rekomendasi bagi '5 ways to kill your dreams'.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Initialize the TfidfVectorizer 
tfidf = ____

# Construct the TF-IDF matrix
tfidf_matrix = ____

# Generate the cosine similarity matrix
cosine_sim = ____
 
# Generate recommendations 
print(get_recommendations(____, ____, indices))
Edit dan Jalankan Kode