演習

LDA モデル

いよいよLDA モデルを構築します。dictionary と corpus を使って、Enron のメールにどんなトピックが含まれているかを探っていきます。各トピックに割り当てられた単語をさっと出力してみると、目立つトピックがあるかどうかの初期確認ができます。なお、トピックモデルは計算コストが高いため、実行に時間がかかります。さっそく試してみましょう。

指示

100 XP

gensim の models から LDA モデルを構築し、corpus と dictionary を渡してください。
モデルの結果に対して print でトピックを出力し、5 つのトピックを保存し、各トピックの上位 5 語を取得してください。

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}演習

指示

演習