Ein bisschen Twitter-Textanalyse

Jetzt, wo dein DataFrame mit Tweets steht, machst du eine kleine Textanalyse und zählst, wie viele Tweets die Wörter 'clinton', 'trump', 'sanders' und 'cruz' enthalten. Im Vorabcode haben wir die folgende Funktion word_in_text() definiert, die dir sagt, ob das erste Argument (ein Wort) im zweiten Argument (ein Tweet) vorkommt.

import re

def word_in_text(word, text):
    word = word.lower()
    text = text.lower()
    match = re.search(word, text)

    if match:
        return True
    return False

Du wirst über die Zeilen des DataFrames iterieren und berechnen, wie viele Tweets jedes unserer Schlüsselwörter enthalten! Die Zählerliste für jede/n Kandidat/in wurde mit 0 initialisiert.

Diese Übung ist Teil des Kurses

<Kurs>Importing Data in Python (Fortgeschritten)</Kurs>

Kurs ansehen

Übungsanweisungen

Innerhalb der Schleife for index, row in df.iterrows(): erhöht der Code derzeit den Wert von clinton um 1, jedes Mal wenn ein Tweet (Textzeile) mit Erwähnung von 'Clinton' gefunden wird; vervollständige den Code so, dass dasselbe für trump, sanders und cruz passiert.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Initialize list to store tweet counts
[clinton, trump, sanders, cruz] = [0, 0, 0, 0]

# Iterate through df, counting the number of tweets in which
# each candidate is mentioned
for index, row in df.iterrows():
    clinton += word_in_text('clinton', row['text'])
    trump += word_in_text(____, ____)
    sanders += word_in_text(____, ____)
    cruz += word_in_text(____, ____)

Code bearbeiten und ausführen