Tf-idf dengan Wikipedia
Sekarang giliran Anda menentukan istilah-istilah baru yang signifikan untuk himpunan data teks Anda dengan menerapkan tf-idf dari gensim. Anda kembali akan menggunakan objek korpus dan kamus yang sama seperti pada latihan sebelumnya: dictionary, corpus, dan doc. Apakah tf-idf akan menghasilkan temuan yang lebih menarik pada tingkat dokumen?
TfidfModel telah diimpor untuk Anda dari gensim.models.tfidfmodel.
Latihan ini adalah bagian dari kursus
Pengantar Natural Language Processing di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a new TfidfModel using the corpus: tfidf
tfidf = ____
# Calculate the tfidf weights of doc: tfidf_weights
tfidf_weights = ____
# Print the first five weights
print(____)