1. Nauka
  2. /
  3. Kursy
  4. /
  5. Importowanie danych w Pythonie – poziom średniozaawansowany

Connected

ćwiczenie

Krótka analiza tekstu tweetów

Teraz, gdy masz już gotowy DataFrame z tweetami, czas na krótką analizę tekstu – sprawdzisz, ile tweetów zawiera słowa 'clinton', 'trump', 'sanders' i 'cruz'. W kodzie startowym zdefiniowaliśmy funkcję word_in_text(), która sprawdza, czy pierwszy argument (słowo) występuje w drugim argumencie (tweecie).

import re

def word_in_text(word, text):
    word = word.lower()
    text = text.lower()
    match = re.search(word, text)

    if match:
        return True
    return False

Przejdziesz przez wiersze DataFrame i zliczysz, ile tweetów zawiera każde ze słów kluczowych! Lista obiektów dla każdego kandydata została zainicjowana wartością 0.

Instrukcje

100 XP
  • W pętli for index, row in df.iterrows(): kod aktualnie zwiększa wartość zmiennej clinton o 1 za każdym razem, gdy napotkany zostanie tweet (wiersz tekstowy) wspominający o 'Clinton'. Uzupełnij kod tak, aby to samo działo się dla zmiennych trump, sanders i cruz.