Airline-Tweets-Daten
Der Data Frame twitter_data enthält über 7.000 Tweets über Fluggesellschaften. Die Tweets wurden in der Spalte complaint_label bereits als Beschwerden oder Nicht-Beschwerden klassifiziert. Verschaffe dir einen Eindruck davon, wie viele dieser Tweets Beschwerden sind.
Beachte, dass dies echte Daten von Twitter sind und daher immer das Risiko besteht, dass sie Schimpfwörter oder andere anstößige Inhalte enthalten (in dieser Übung und allen folgenden Übungen, die ebenfalls echte Twitter-Daten verwenden).
Diese Übung ist Teil des Kurses
Einführung in die Textanalyse mit R
Anleitung zur Übung
- Lade das Paket
tidyverse. - Verschaffe dir einen Eindruck von Umfang und Inhalt der Daten, indem du
twitter_dataausgibst. - Filtere
twitter_dataso, dass nur die Beschwerden übrig bleiben. Wie viele Beschwerden sind in den Daten?
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Load the tidyverse packages
___(___)
# Print twitter_data
___
# Print just the complaints in twitter_data
twitter_data %>%
___(___ == ___)