1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶSentiment Analysis

Connected

演習

ツイートからのステム抽出

この演習では、tweets という配列を扱います。これは Twitter から収集した航空会社のセンチメントデータのテキストを含みます。

この配列を処理し、リスト内包表記を使ってトークンのリストに変換してください。その後、トークンのリストを反復し、各トークンからステムを作成します。リスト内包表記は for ループの1行版であることを思い出してください。

指示

100 XP
  • 文字列をステムに変換するために使用する関数をインポートします。
  • 先ほどインポートした Porter ステマー関数を呼び出します。
  • リスト内包表記を使って、tokens リストを作成します。これは tweets 配列のすべての単語トークンを含むようにします。
  • tokens リストを反復し、各要素にステミング関数を適用します。