1. Learn
  2. /
  3. Courses
  4. /
  5. Rで学ぶBag-of-Wordsによるテキストマイニング

Connected

Exercise

より良いワードクラウドを描く

追加のストップワードを除去したので、改善されたワードクラウドを見てみましょう!

前の演習の用語文書行列は as.matrix() で行列に変換し、rowSums() で名前付きベクトルを作成しました。用語頻度を表す新しいオブジェクト chardonnay_words はワークスペースにあらかじめ読み込まれています。これらの新しいワードクラウドの結果を確認していきます。

Instructions

100 XP

wordcloud パッケージは舞台裏で読み込んでおり、この後の必要な演習でも同様に行います。

  • chardonnay_words の値を decreasing = TRUE で並べ替え、sorted_chardonnay_words として保存します。
  • sorted_chardonnay_words の上位6語とそれぞれの値を確認します。
  • chardonnay_words に対して names() を使って terms_vec を作成します。
  • terms_vec と chardonnay_words を wordcloud() 関数に渡します。"chardonnay" を除外したことで、どんな単語が目立つようになったかを確認しましょう。