1. Learn
  2. /
  3. Courses
  4. /
  5. Rで学ぶ自然言語処理入門

Connected

Exercise

LDA 結果の確認

メインキャラクターの Napoleon に言及している『Animal Farm』の文を対象に、5 つのトピックからなるトピックモデル napoleon_model を作成しました。各トピックについて、上位の単語と上位の文を 5 人のローカル著者にレビューしてもらい、各トピックのテーマを提示してもらっています。

最終結果として、各トピックの要約統計量を準備しましょう。これらの要約値をテーマとあわせて上司に提出します。

Instructions

100 XP
  • トピックモデル napoleon_model から gamma 行列を抽出します。
  • dplyr の関数を使って、各文で最も確からしいトピックを示す tibble grouped_gammas を作成します。
  • grouped_gammas を用いて、各トピックに最も近い文の数を数えます。
  • grouped_gammas を使って、各トピックの gamma の平均値を計算します。