LoslegenKostenlos loslegen

Ein bisschen Twitter-Textanalyse

Jetzt, wo dein DataFrame mit Tweets steht, machst du eine kleine Textanalyse und zählst, wie viele Tweets die Wörter 'clinton', 'trump', 'sanders' und 'cruz' enthalten. Im Vorabcode haben wir die folgende Funktion word_in_text() definiert, die dir sagt, ob das erste Argument (ein Wort) im zweiten Argument (ein Tweet) vorkommt.

import re

def word_in_text(word, text):
    word = word.lower()
    text = text.lower()
    match = re.search(word, text)

    if match:
        return True
    return False

Du wirst über die Zeilen des DataFrames iterieren und berechnen, wie viele Tweets jedes unserer Schlüsselwörter enthalten! Die Zählerliste für jede/n Kandidat/in wurde mit 0 initialisiert.

Diese Übung ist Teil des Kurses

Importing Data in Python (Fortgeschritten)

Kurs anzeigen

Anleitung zur Übung

  • Innerhalb der Schleife for index, row in df.iterrows(): erhöht der Code derzeit den Wert von clinton um 1, jedes Mal wenn ein Tweet (Textzeile) mit Erwähnung von 'Clinton' gefunden wird; vervollständige den Code so, dass dasselbe für trump, sanders und cruz passiert.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Initialize list to store tweet counts
[clinton, trump, sanders, cruz] = [0, 0, 0, 0]

# Iterate through df, counting the number of tweets in which
# each candidate is mentioned
for index, row in df.iterrows():
    clinton += word_in_text('clinton', row['text'])
    trump += word_in_text(____, ____)
    sanders += word_in_text(____, ____)
    cruz += word_in_text(____, ____)
Code bearbeiten und ausführen