1. Learn
  2. /
  3. Kurser
  4. /
  5. Python 数据导入进阶

Connected

övning

做一点 Twitter 文本分析

现在您已经构建好了包含推文的 DataFrame,接下来要做一个简单的文本分析,统计包含 'clinton'、'trump'、'sanders' 和 'cruz' 这几个词的推文数量。在练习前置代码中,我们定义了函数 word_in_text(),用于判断第 1 个参数(单词)是否出现在第 2 个参数(推文)中。

import re

def word_in_text(word, text):
    word = word.lower()
    text = text.lower()
    match = re.search(word, text)

    if match:
        return True
    return False

您将遍历 DataFrame 的每一行,计算包含各个关键词的推文数量!每位候选人的计数对象列表已初始化为 0。

Instruktioner

100 XP
  • 在 for 循环 for index, row in df.iterrows(): 中,当前代码在遇到包含 "Clinton" 的推文(text 行)时,会将 clinton 的值加 1;请补全代码,使 trump、sanders 和 cruz 同样在相应推文出现时各自加 1。