Benutzertypen zählen

Häufigkeiten sind die wichtigste Zusammenfassung für kategoriale Daten. Da Text kategorial ist, ist es wichtig, sicher im Zählen zu werden. twitter_data besteht aus Beschwerden und Nicht-Beschwerden, gekennzeichnet durch die Spalte complaint_label, und enthält außerdem eine Spalte, die angibt, ob ein Nutzer verifiziert ist (d. h. von Twitter als die Person bestätigt wurde, die er vorgibt zu sein), namens usr_verified. Beachte, dass diese Spalte vom Typ <lgl> ist, also logisch. Beschweren sich verifizierte Nutzer häufiger?

Diese Übung ist Teil des Kurses

Einführung in die Textanalyse mit R

Kurs anzeigen

Anleitung zur Übung

Lade das Paket tidyverse, das dplyr und ggplot2 enthält.
Filtere die Daten, sodass nur Tweets mit Beschwerden übrig bleiben.
Zähle, wie viele verifizierte und nicht verifizierte Nutzer sich beschwert haben.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Load the tidyverse package
___(___)

twitter_data %>% 
  # Filter for just the complaints
  ___(___) %>% 
  # Count the number of verified and non-verified users
  ___(___)

Code bearbeiten und ausführen