Ein bisschen Twitter-Textanalyse
Jetzt, wo dein DataFrame mit Tweets steht, machst du eine kleine Textanalyse und zählst, wie viele Tweets die Wörter 'clinton', 'trump', 'sanders' und 'cruz' enthalten. Im Vorabcode haben wir die folgende Funktion word_in_text() definiert, die dir sagt, ob das erste Argument (ein Wort) im zweiten Argument (ein Tweet) vorkommt.
import re
def word_in_text(word, text):
word = word.lower()
text = text.lower()
match = re.search(word, text)
if match:
return True
return False
Du wirst über die Zeilen des DataFrames iterieren und berechnen, wie viele Tweets jedes unserer Schlüsselwörter enthalten! Die Zählerliste für jede/n Kandidat/in wurde mit 0 initialisiert.
Diese Übung ist Teil des Kurses
Importing Data in Python (Fortgeschritten)
Anleitung zur Übung
- Innerhalb der Schleife
for index, row in df.iterrows():erhöht der Code derzeit den Wert vonclintonum1, jedes Mal wenn ein Tweet (Textzeile) mit Erwähnung von 'Clinton' gefunden wird; vervollständige den Code so, dass dasselbe fürtrump,sandersundcruzpassiert.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Initialize list to store tweet counts
[clinton, trump, sanders, cruz] = [0, 0, 0, 0]
# Iterate through df, counting the number of tweets in which
# each candidate is mentioned
for index, row in df.iterrows():
clinton += word_in_text('clinton', row['text'])
trump += word_in_text(____, ____)
sanders += word_in_text(____, ____)
cruz += word_in_text(____, ____)