1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶSentiment Analysis

Connected

Exercise

映画レビューでワードクラウド

これまでに 映画レビュー データセットを扱い、評価の分布を確認し、最長・最短のレビューの長さも見てきました。では、ポジティブレビューとネガティブレビューはそれぞれ何について語っているのでしょうか?

この演習では、上位100件のポジティブレビューからワードクラウドを作成する練習をします。

どんな単語が目立つでしょうか?直感に合っていますか?

文字列 descriptions は、上位100件のポジティブレビューの説明文を連結して作成されています。映画に特化したストップワード(the, a/an, and などの非常に頻出するが情報量の少ない語で、グラフから除外したい語)の集合は my_stopwords として用意されています。interpolation 引数を使うと、ワードクラウドの表示がより滑らかになることを思い出してください。

Instrukcje

100 XP
  • 対応するパッケージから wordcloud 関数をインポートします。
  • descriptions 文字列にワードクラウド関数を適用します。背景色は 'white' に設定し、stopwords 引数を変更してください。
  • ワードクラウド画像を作成します。
  • 最後に、画像を表示するのを忘れないでください。