Rekomendasi TED Talk
Dalam latihan ini, kita akan membangun sistem rekomendasi yang menyarankan TED Talk berdasarkan transkripnya. Anda telah diberikan fungsi get_recommendations() yang menerima judul sebuah talk, sebuah matriks kesamaan, dan sebuah series indices sebagai argumen, lalu menghasilkan daftar talk yang paling mirip. indices telah disediakan untuk Anda.
Anda juga diberikan sebuah series transcripts yang berisi transkrip sekitar 500 TED Talk. Tugas Anda adalah menghasilkan matriks kesamaan kosinus untuk vektor tf-idf dari transkrip talk tersebut.
Selanjutnya, kita akan menghasilkan rekomendasi untuk talk berjudul '5 ways to kill your dreams' oleh wirausahawan Brasil, Bel Pesce.
Latihan ini adalah bagian dari kursus
Rekayasa Fitur untuk NLP di Python
Petunjuk latihan
- Inisialisasi
TfidfVectorizerdengan stopwords bahasa Inggris. Beri namatfidf. - Bangun
tfidf_matrixdengan melakukan fit dan transform padatranscripts. - Hasilkan matriks kesamaan kosinus
cosine_simmenggunakantfidf_matrix. - Gunakan
get_recommendations()untuk menghasilkan rekomendasi bagi '5 ways to kill your dreams'.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Initialize the TfidfVectorizer
tfidf = ____
# Construct the TF-IDF matrix
tfidf_matrix = ____
# Generate the cosine similarity matrix
cosine_sim = ____
# Generate recommendations
print(get_recommendations(____, ____, indices))