1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Intermediate Importing Data in Python

Connected

cvičení

Trocha textové analýzy tweetů

Teď, když máš DataFrame s tweety připravený, provedeš jednoduchou textovou analýzu – spočítáš, kolik tweetů obsahuje slova 'clinton', 'trump', 'sanders' a 'cruz'. V kódu před cvičením jsme definovali funkci word_in_text(), která zjistí, jestli se první argument (slovo) vyskytuje ve druhém argumentu (tweetu).

import re

def word_in_text(word, text):
    word = word.lower()
    text = text.lower()
    match = re.search(word, text)

    if match:
        return True
    return False

Budeš procházet řádky DataFramu a zjišťovat, kolik tweetů obsahuje každé z hledaných slov! Seznam objektů pro každého kandidáta byl inicializován na hodnotu 0.

Pokyny

100 XP
  • Ve smyčce for index, row in df.iterrows(): kód aktuálně zvyšuje hodnotu clinton o 1 pokaždé, když narazí na tweet (textový řádek) zmiňující 'Clinton'; doplň kód tak, aby se stejná logika použila i pro trump, sanders a cruz.