Benutzertypen zählen
Häufigkeiten sind die wichtigste Zusammenfassung für kategoriale Daten. Da Text kategorial ist, ist es wichtig, sicher im Zählen zu werden. twitter_data besteht aus Beschwerden und Nicht-Beschwerden, gekennzeichnet durch die Spalte complaint_label, und enthält außerdem eine Spalte, die angibt, ob ein Nutzer verifiziert ist (d. h. von Twitter als die Person bestätigt wurde, die er vorgibt zu sein), namens usr_verified. Beachte, dass diese Spalte vom Typ <lgl> ist, also logisch. Beschweren sich verifizierte Nutzer häufiger?
Diese Übung ist Teil des Kurses
Einführung in die Textanalyse mit R
Anleitung zur Übung
- Lade das Paket
tidyverse, dasdplyrundggplot2enthält. - Filtere die Daten, sodass nur Tweets mit Beschwerden übrig bleiben.
- Zähle, wie viele verifizierte und nicht verifizierte Nutzer sich beschwert haben.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Load the tidyverse package
___(___)
twitter_data %>%
# Filter for just the complaints
___(___) %>%
# Count the number of verified and non-verified users
___(___)