1. Learn
  2. /
  3. Courses
  4. /
  5. Rで学ぶ自然言語処理入門

Connected

Exercise

LDA の練習

あなたの大好きな新しい本『Animal Farm』で、登場人物 Napoleon をめぐる共通のテーマに関心があります。Napoleon は仲間の動物たちを説得して人間の支配者を打倒させるブタで、最終的には Animal Farm の新しいリーダーになります。

Napoleon の名前が出てくるすべての文を pig_sentences に抽出し、ストップワードを除去してステミングも行ったトークン化データを pig_tokens として作成しました。これらの文に対して LDA を実行し、各トピックに関連する上位の単語を確認してください。

Instructions

100 XP
  • pig_matrix に対して LDA を実行し、トピック数は 10 に設定します。再現性のため乱数シードを 1111 に設定してください。
  • 結果から beta 行列を抽出します。
  • beta 行列をトピック 2 のみにフィルタし、beta の値が大きい順に並べ替えます。
  • beta 行列をトピック 3 のみにフィルタし、beta の値が大きい順に並べ替えます。