Airline-Tweets-Daten

Der Data Frame twitter_data enthält über 7.000 Tweets über Fluggesellschaften. Die Tweets wurden in der Spalte complaint_label bereits als Beschwerden oder Nicht-Beschwerden klassifiziert. Verschaffe dir einen Eindruck davon, wie viele dieser Tweets Beschwerden sind.

Beachte, dass dies echte Daten von Twitter sind und daher immer das Risiko besteht, dass sie Schimpfwörter oder andere anstößige Inhalte enthalten (in dieser Übung und allen folgenden Übungen, die ebenfalls echte Twitter-Daten verwenden).

Diese Übung ist Teil des Kurses

<Kurs>Einführung in die Textanalyse mit R</Kurs>

Kurs ansehen

Übungsanweisungen

Lade das Paket tidyverse.
Verschaffe dir einen Eindruck von Umfang und Inhalt der Daten, indem du twitter_data ausgibst.
Filtere twitter_data so, dass nur die Beschwerden übrig bleiben. Wie viele Beschwerden sind in den Daten?

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Load the tidyverse packages
___(___)

# Print twitter_data
___

# Print just the complaints in twitter_data
twitter_data %>% 
  ___(___ == ___)

Code bearbeiten und ausführen