Gruppierte Zusammenfassungen

In twitter_data gibt es also mehr Nicht-Beschwerden als Beschwerden. Du fragst dich vielleicht, ob diese Daten überhaupt von Twitter stammen! Es gibt ein paar weitere interessante Spalten in twitter_data, die du dir ansehen solltest, bevor du zu den eigentlichen Tweets kommst. Jeder Tweet enthält in der Spalte usr_followers_count die Anzahl der Follower der jeweiligen Person. Erwartest du, dass diejenigen, die sich beschweren, im Durchschnitt mehr oder weniger Follower haben als diejenigen, die sich nicht beschweren? Mit gruppierten Zusammenfassungen kannst du schnell und einfach eine Antwort finden.

Diese Übung ist Teil des Kurses

<Kurs>Einführung in die Textanalyse mit R</Kurs>

Kurs ansehen

Übungsanweisungen

Gruppiere die Daten nach complaint_label.
Berechne die durchschnittliche, minimale und maximale Anzahl von usr_followers_count.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Start with the data frame
___ %>% 
  # Group the data by whether or not the tweet is a complaint
  ___(___) %>% 
  # Compute the mean, min, and max follower counts
  summarize(
    avg_followers = ___(___),
    min_followers = ___(___),
    max_followers = ___(___)
  )

Code bearbeiten und ausführen