1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ不正検知

Connected

演習

LDA モデル

いよいよLDA モデルを構築します。dictionary と corpus を使って、Enron のメールにどんなトピックが含まれているかを探っていきます。各トピックに割り当てられた単語をさっと出力してみると、目立つトピックがあるかどうかの初期確認ができます。なお、トピックモデルは計算コストが高いため、実行に時間がかかります。さっそく試してみましょう。

指示

100 XP
  • gensim の models から LDA モデルを構築し、corpus と dictionary を渡してください。
  • モデルの結果に対して print でトピックを出力し、5 つのトピックを保存し、各トピックの上位 5 語を取得してください。