1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. Rで学ぶBag-of-Wordsによるテキストマイニング

Connected

अभ्यास

ケージマッチ 第2ラウンド!ネガティブレビュー

両社ともに、人々は「culture」や「smart people」に言及しており、ポジティブな側面には共通点があることがわかります。ただし、ピラミッドプロットを使うと、職場環境のポジティブ度合いの違いを推測し始めることができます。

次はネガティブレビューに目を向け、同じ可視化を作成してみましょう。今回は、作業スペースにすでに common_words データフレームがあります。ただし、この演習で使う共通バイグラムは、従業員の「ネガティブ」レビューから抽出したものです。

निर्देश

100 XP
  • common_words に対して slice_max() を使い、diff 列に基づく上位 5 個のバイグラムを取得します。新しいオブジェクトの結果はコンソールに表示されます。
  • pyramid.plot() を作成します。top5_df$AmazonNeg、top5_df$GoogleNeg、labels = top5_df$terms を渡してください。見やすくするために、以下を設定します。
    • gap を 12 にします。
    • top.labels を c("Amzn", "Neg Words", "Goog") にします。

main と unit 引数はあらかじめ設定されています。