Ein bisschen Twitter-Textanalyse
Nachdem du nun deinen DataFrame mit den Tweets erstellt hast, wirst du eine kleine Textanalyse durchführen, um zu zählen, wie viele Tweets die Wörter 'clinton'
, 'trump'
, 'sanders'
und 'cruz'
enthalten. Im Code der Vorübung haben wir die folgende Funktion word_in_text()
definiert, die dir sagt, ob das erste Argument (ein Wort) im zweiten Argument (ein Tweet) vorkommt.
import re
def word_in_text(word, text):
word = word.lower()
text = text.lower()
match = re.search(word, text)
if match:
return True
return False
Du wirst über die Zeilen des DataFrame iterieren und berechnen, wie viele Tweets jedes unserer Schlüsselwörter enthalten! Die Liste der Objekte für jeden Kandidaten wurde auf 0 initialisiert.
Diese Übung ist Teil des Kurses
Daten in Python importieren für fortgeschrittene Anfänger
Anleitung zur Übung
- Innerhalb der
for
Schleifefor index, row in df.iterrows():
erhöht der Code derzeit den Wert vonclinton
um1
jedes Mal, wenn ein Tweet (Textzeile) auftaucht, in dem "Clinton" erwähnt wird; ergänze den Code so, dass dasselbe fürtrump
,sanders
undcruz
passiert.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Initialize list to store tweet counts
[clinton, trump, sanders, cruz] = [0, 0, 0, 0]
# Iterate through df, counting the number of tweets in which
# each candidate is mentioned
for index, row in df.iterrows():
clinton += word_in_text('clinton', row['text'])
trump += word_in_text(____, ____)
sanders += word_in_text(____, ____)
cruz += word_in_text(____, ____)