MulaiMulai sekarang secara gratis

Tf-idf dengan Wikipedia

Sekarang giliran Anda menentukan istilah-istilah baru yang signifikan untuk himpunan data teks Anda dengan menerapkan tf-idf dari gensim. Anda kembali akan menggunakan objek korpus dan kamus yang sama seperti pada latihan sebelumnya: dictionary, corpus, dan doc. Apakah tf-idf akan menghasilkan temuan yang lebih menarik pada tingkat dokumen?

TfidfModel telah diimpor untuk Anda dari gensim.models.tfidfmodel.

Latihan ini adalah bagian dari kursus

Pengantar Natural Language Processing di Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create a new TfidfModel using the corpus: tfidf
tfidf = ____

# Calculate the tfidf weights of doc: tfidf_weights
tfidf_weights = ____

# Print the first five weights
print(____)
Edit dan Jalankan Kode