1. 学ぶ
  2. /
  3. コース
  4. /
  5. Intermediate Importing Data in Python

Connected

演習

Twitter テキストを少しだけ分析してみましょう

ツイートの DataFrame を用意できたので、テキスト分析を少し行い、単語 'clinton'、'trump'、'sanders'、'cruz' を含むツイートがそれぞれ何件あるか数えてみましょう。事前コードでは、次の関数 word_in_text() を定義しています。これは、第1引数(単語)が第2引数(ツイート)の中に現れるかどうかを判定します。

import re

def word_in_text(word, text):
    word = word.lower()
    text = text.lower()
    match = re.search(word, text)

    if match:
        return True
    return False

DataFrame の各行を反復処理し、各キーワードを含むツイート数を集計します。各候補者に対応するカウンタの初期値は 0 に設定済みです。

指示

100 XP
  • for index, row in df.iterrows(): という for ループ内で、現在のコードは「Clinton」に言及しているツイート(テキスト行)に出会うたびに clinton の値を 1 増やします。trump、sanders、cruz についても同様になるようにコードを完成させてください。