Ein bisschen Twitter-Textanalyse
Nachdem du nun deinen DataFrame mit den Tweets erstellt hast, wirst du eine kleine Textanalyse durchführen, um zu zählen, wie viele Tweets die Wörter 'clinton', 'trump', 'sanders' und 'cruz' enthalten. Im Code der Vorübung haben wir die folgende Funktion word_in_text() definiert, die dir sagt, ob das erste Argument (ein Wort) im zweiten Argument (ein Tweet) vorkommt.
import re
def word_in_text(word, text):
word = word.lower()
text = text.lower()
match = re.search(word, text)
if match:
return True
return False
Du wirst über die Zeilen des DataFrame iterieren und berechnen, wie viele Tweets jedes unserer Schlüsselwörter enthalten! Die Liste der Objekte für jeden Kandidaten wurde auf 0 initialisiert.
Diese Übung ist Teil des Kurses
Daten in Python importieren für fortgeschrittene Anfänger
Anleitung zur Übung
- Innerhalb der
forSchleifefor index, row in df.iterrows():erhöht der Code derzeit den Wert vonclintonum1jedes Mal, wenn ein Tweet (Textzeile) auftaucht, in dem "Clinton" erwähnt wird; ergänze den Code so, dass dasselbe fürtrump,sandersundcruzpassiert.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Initialize list to store tweet counts
[clinton, trump, sanders, cruz] = [0, 0, 0, 0]
# Iterate through df, counting the number of tweets in which
# each candidate is mentioned
for index, row in df.iterrows():
clinton += word_in_text('clinton', row['text'])
trump += word_in_text(____, ____)
sanders += word_in_text(____, ____)
cruz += word_in_text(____, ____)