Gruppierte Zusammenfassungen
In twitter_data gibt es also mehr Nicht-Beschwerden als Beschwerden. Du fragst dich vielleicht, ob diese Daten überhaupt von Twitter stammen! Es gibt ein paar weitere interessante Spalten in twitter_data, die du dir ansehen solltest, bevor du zu den eigentlichen Tweets kommst. Jeder Tweet enthält in der Spalte usr_followers_count die Anzahl der Follower der jeweiligen Person. Erwartest du, dass diejenigen, die sich beschweren, im Durchschnitt mehr oder weniger Follower haben als diejenigen, die sich nicht beschweren? Mit gruppierten Zusammenfassungen kannst du schnell und einfach eine Antwort finden.
Diese Übung ist Teil des Kurses
Einführung in die Textanalyse mit R
Anleitung zur Übung
- Gruppiere die Daten nach
complaint_label. - Berechne die durchschnittliche, minimale und maximale Anzahl von
usr_followers_count.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Start with the data frame
___ %>%
# Group the data by whether or not the tweet is a complaint
___(___) %>%
# Compute the mean, min, and max follower counts
summarize(
avg_followers = ___(___),
min_followers = ___(___),
max_followers = ___(___)
)