1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶSentiment Analysis

Connected

演習

ストップワードを使った航空会社の感情分析

tweets というデータセットが与えられています。これは航空会社に関する顧客のレビューと感情を含みます。列は airline_sentiment と text の2つで、前者は positive / negative / neutral のいずれかの感情、text はツイート本文です。

この演習では、ストップワードを考慮した BOW(Bag-of-Words)表現を作成します。ストップワードは有益な情報を持たないことが多く、除去したほうがよい場合があります。そうすることで語彙が小さくなり、最終的に特徴量も少なくなります。なお、デフォルトのストップワード一覧に、今回の文脈に特有の語を追加して拡張できることも覚えておきましょう。

指示

100 XP
  • 英語のデフォルトのストップワード一覧をインポートします。
  • 与えられた ['airline', 'airlines', '@'] をデフォルトの一覧に追加して my_stop_words を作成します。
  • ベクトライザでストップワードの引数を指定します。