1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶBag-of-Wordsによるテキストマイニング

Connected

演習

ステップ 2: テキストソースの特定

社員のレビューはさまざまなソースから集められます。人事部門に十分なリソースがあれば、第三者に依頼してフォーカスグループを実施し、自社と競合他社の社員にインタビューすることもできます。

Forbes などは「働きがいのある会社」に関する記事を掲載しており、Amazon や Google が言及されることもあります。別の情報源としては、Indeed、Glassdoor、CareerBliss のようなサイトにある匿名のオンラインレビューが考えられます。

ここでは、匿名のオンラインレビューのコレクションに焦点を当てます。

指示

100 XP
  • str() で amzn の構造を表示し、次元とデータのプレビューを確認します。
  • 好意的なレビューの列 amzn$pros から amzn_pros を作成します。
  • 否定的なレビューの列 amzn$cons から amzn_cons を作成します。
  • str() で goog の構造を表示し、次元とデータのプレビューを確認します。
  • 好意的なレビューの列 goog$pros から goog_pros を作成します。
  • 否定的なレビューの列 goog$cons から goog_cons を作成します。