LoslegenKostenlos loslegen

Benutzertypen zählen

Häufigkeiten sind die wichtigste Zusammenfassung für kategoriale Daten. Da Text kategorial ist, ist es wichtig, sicher im Zählen zu werden. twitter_data besteht aus Beschwerden und Nicht-Beschwerden, gekennzeichnet durch die Spalte complaint_label, und enthält außerdem eine Spalte, die angibt, ob ein Nutzer verifiziert ist (d. h. von Twitter als die Person bestätigt wurde, die er vorgibt zu sein), namens usr_verified. Beachte, dass diese Spalte vom Typ <lgl> ist, also logisch. Beschweren sich verifizierte Nutzer häufiger?

Diese Übung ist Teil des Kurses

Einführung in die Textanalyse mit R

Kurs anzeigen

Anleitung zur Übung

  • Lade das Paket tidyverse, das dplyr und ggplot2 enthält.
  • Filtere die Daten, sodass nur Tweets mit Beschwerden übrig bleiben.
  • Zähle, wie viele verifizierte und nicht verifizierte Nutzer sich beschwert haben.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Load the tidyverse package
___(___)

twitter_data %>% 
  # Filter for just the complaints
  ___(___) %>% 
  # Count the number of verified and non-verified users
  ___(___)
Code bearbeiten und ausführen