1. Learn
  2. /
  3. Cursuri
  4. /
  5. Importul intermediar de date în Python

Connected

exercițiu

O mică analiză a textului de pe Twitter

Acum că ai creat DataFrame-ul cu tweet-uri, vei face o mică analiză de text pentru a număra câte tweet-uri conțin cuvintele 'clinton', 'trump', 'sanders' și 'cruz'. În codul pre-exercițiu am definit funcția word_in_text(), care verifică dacă primul argument (un cuvânt) apare în cel de-al doilea argument (un tweet).

import re

def word_in_text(word, text):
    word = word.lower()
    text = text.lower()
    match = re.search(word, text)

    if match:
        return True
    return False

Vei parcurge rândurile DataFrame-ului și vei calcula câte tweet-uri conțin fiecare dintre cuvintele cheie! Lista de valori pentru fiecare candidat a fost inițializată la 0.

Instrucțiuni

100 XP
  • În interiorul buclei for index, row in df.iterrows():, codul crește în prezent valoarea lui clinton cu 1 de fiecare dată când este întâlnit un tweet (rând de text) care menționează 'Clinton'; completează codul astfel încât același lucru să se întâmple și pentru trump, sanders și cruz.