LoslegenKostenlos loslegen

Airline-Tweets-Daten

Der Data Frame twitter_data enthält über 7.000 Tweets über Fluggesellschaften. Die Tweets wurden in der Spalte complaint_label bereits als Beschwerden oder Nicht-Beschwerden klassifiziert. Verschaffe dir einen Eindruck davon, wie viele dieser Tweets Beschwerden sind.

Beachte, dass dies echte Daten von Twitter sind und daher immer das Risiko besteht, dass sie Schimpfwörter oder andere anstößige Inhalte enthalten (in dieser Übung und allen folgenden Übungen, die ebenfalls echte Twitter-Daten verwenden).

Diese Übung ist Teil des Kurses

Einführung in die Textanalyse mit R

Kurs anzeigen

Anleitung zur Übung

  • Lade das Paket tidyverse.
  • Verschaffe dir einen Eindruck von Umfang und Inhalt der Daten, indem du twitter_data ausgibst.
  • Filtere twitter_data so, dass nur die Beschwerden übrig bleiben. Wie viele Beschwerden sind in den Daten?

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Load the tidyverse packages
___(___)

# Print twitter_data
___

# Print just the complaints in twitter_data
twitter_data %>% 
  ___(___ == ___)
Code bearbeiten und ausführen