1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶBag-of-Wordsによるテキストマイニング

Connected

演習

Googleレビューのクイックレビュー

Amazon と比較するために、Google の肯定的レビューと否定的レビューの comparison.cloud() を作成することにしました。これにより、前の演習で Amazon のレビューを詳しく読み込んだときほど時間をかけずに、主要な用語を手早く把握できます。

こちらで用意したコーパス all_goog_corpus には、Google の肯定的レビュー500件と否定的レビュー500件が含まれています。ここでは、このコーパスをクリーニングし、賛否両方のレビューで共通する単語を比較する比較クラウドを作成します。

指示

100 XP

Google の賛否レビューからなる all_goog_corpus オブジェクトは、ワークスペースに読み込まれています。

  • 事前定義された関数 tm_clean() で all_goog_corpus をクリーニングして、all_goog_corp を作成します。
  • all_goog_corp を用語-文書行列に変換して、all_tdm を作成します。
  • all_tdm を行列に変換して、all_m を作成します。
  • all_m から comparison.cloud() を作成します。max.words は 100 に設定します。colors 引数はすでに指定されています。