1. Learn
  2. /
  3. Kurser
  4. /
  5. Importera data i Python – fortsättningskurs

Connected

övning

En kort textanalys av tweets

Nu när du har satt upp din DataFrame med tweets ska du göra en enkel textanalys för att räkna hur många tweets som innehåller orden 'clinton', 'trump', 'sanders' och 'cruz'. I koden som körs innan övningen har vi definierat funktionen word_in_text(), som kontrollerar om det första argumentet (ett ord) förekommer i det andra argumentet (en tweet).

import re

def word_in_text(word, text):
    word = word.lower()
    text = text.lower()
    match = re.search(word, text)

    if match:
        return True
    return False

Du ska iterera över raderna i DataFrame:n och beräkna hur många tweets som innehåller vart och ett av nyckelorden! Räknarvariabeln för varje kandidat har initierats till 0.

Instruktioner

100 XP
  • I for-loopen for index, row in df.iterrows(): ökar koden för närvarande värdet av clinton med 1 varje gång en tweet (en textrad) som nämner 'Clinton' påträffas. Komplettera koden så att samma sak sker för trump, sanders och cruz.