Model LDA
Sekarang saatnya membangun model LDA. Dengan menggunakan dictionary dan corpus, Anda siap menemukan topik-topik yang ada dalam email Enron. Dengan cepat mencetak kata-kata yang ditetapkan ke topik, Anda dapat melakukan eksplorasi awal untuk melihat apakah ada topik yang langsung menonjol. Perlu diingat bahwa model topik berat secara komputasi, sehingga butuh waktu untuk dijalankan. Mari kita coba!
Latihan ini adalah bagian dari kursus
Deteksi Kecurangan di Python
Petunjuk latihan
- Bangun model LDA dari gensim models, dengan memasukkan
corpusdandictionary. - Simpan 5 topik dengan menjalankan
printtopik pada hasil model, dan pilih 5 kata teratas.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Define the LDA model
ldamodel = gensim.models.____.____(____, num_topics=5, id2word=____, passes=5)
# Save the topics and top 5 words
topics = ____.____(num_words=____)
# Print the results
for topic in topics:
print(topic)