1. Învăţa
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶSentiment Analysis

Connected

exercise

複数のテキスト列

この演習では、航空会社のTwitterデータを引き続き扱います。データセット tweets は読み込まれています。

データセットに複数のテキスト列があり、それぞれに数値表現を作りたい場合があります。ここでは、ツイート本文が入った text 列に加えて、もう1つのテキスト列 negativereason があります。これは顧客が否定的なレビューをした理由を表します。

あなたのタスクは、両方の列に対してBOW表現を作成し、必要なストップワードを指定することです。

Instrucţiuni

100 XP
  • ベクトライザーのパッケージと英語の既定ストップワード一覧をインポートしてください。
  • 英語の既定ストップワード一覧を更新し、my_stop_words セットを作成してください。
  • 1つ目のベクトライザーではストップワード引数に更新後のセットを、2つ目のベクトライザーでは英語の既定ストップワード一覧を指定してください。