1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phát hiện gian lận với Python

Connected

Bài tập

Mô hình LDA

Giờ là lúc xây dựng mô hình LDA. Với dictionary và corpus, bạn đã sẵn sàng khám phá các chủ đề xuất hiện trong email Enron. In nhanh các từ được gán cho từng chủ đề để có cái nhìn sơ bộ xem có chủ đề nào nổi bật hay không. Lưu ý rằng mô hình chủ đề tốn nhiều tài nguyên để tính toán, nên sẽ mất một lúc để chạy. Hãy thử nhé!

Hướng dẫn

100 XP
  • Xây dựng mô hình LDA từ gensim models bằng cách truyền vào corpus và dictionary.
  • Lưu 5 chủ đề bằng cách chạy print topics trên kết quả mô hình, và chọn 5 từ đứng đầu.