Erste SchritteKostenlos loslegen

Ein bisschen Twitter-Textanalyse

Nachdem du nun deinen DataFrame mit den Tweets erstellt hast, wirst du eine kleine Textanalyse durchführen, um zu zählen, wie viele Tweets die Wörter 'clinton', 'trump', 'sanders' und 'cruz' enthalten. Im Code der Vorübung haben wir die folgende Funktion word_in_text() definiert, die dir sagt, ob das erste Argument (ein Wort) im zweiten Argument (ein Tweet) vorkommt.

import re

def word_in_text(word, text):

    word = word.lower()

    text = text.lower()

    match = re.search(word, text)


    if match:

        return True

    return False

Du wirst über die Zeilen des DataFrame iterieren und berechnen, wie viele Tweets jedes unserer Schlüsselwörter enthalten! Die Liste der Objekte für jeden Kandidaten wurde auf 0 initialisiert.

Diese Übung ist Teil des Kurses

Daten in Python importieren für fortgeschrittene Anfänger

Kurs anzeigen

Anleitung zur Übung

  • Innerhalb der for Schleife for index, row in df.iterrows(): erhöht der Code derzeit den Wert von clinton um 1 jedes Mal, wenn ein Tweet (Textzeile) auftaucht, in dem "Clinton" erwähnt wird; ergänze den Code so, dass dasselbe für trump, sanders und cruz passiert.

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Initialize list to store tweet counts
[clinton, trump, sanders, cruz] = [0, 0, 0, 0]

# Iterate through df, counting the number of tweets in which
# each candidate is mentioned
for index, row in df.iterrows():
    clinton += word_in_text('clinton', row['text'])
    trump += word_in_text(____, ____)
    sanders += word_in_text(____, ____)
    cruz += word_in_text(____, ____)
Bearbeiten und Ausführen von Code