1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶソーシャルメディアデータ分析

Connected

演習

トピックモデルを作成する

トピックモデリングは、大量のテキストから自動的にトピックを抽出するタスクです。

ツイートのテキストからトピックモデルを作成すると、膨大な情報を明確なトピックに手早く要約し、インサイトを得られます。

この演習では、"Climate change" に関するツイートから異なるトピックを抽出します。

"Climate change" のツイートのDTMは dtm_climate_new としてあらかじめ読み込まれています。

この演習ではライブラリ topicmodels も読み込まれています。

指示1 / 2

undefined XP
  • 1
    • DTMから潜在的ディリクレ配分法(LDA)を使って、5トピックのトピックモデルを作成します。
    • そのトピックモデルで上位10語を選び、表示します。
  • 2
    • 今度は、同じくLDAを使ってDTMから4トピックのトピックモデルを作成します。
    • この新しいトピックモデルで上位6語を選び、表示します。