LoslegenKostenlos loslegen

Nach Produkt zählen und neu anordnen

tidy_twitter wurde tokenisiert, und Stoppwörter (inklusive benutzerdefinierter Stoppwörter) wurden entfernt. Du möchtest die Unterschiede in den Worthäufigkeiten zwischen Beschwerden und Nicht-Beschwerden visualisieren.

Diese Übung ist Teil des Kurses

Einführung in die Textanalyse mit R

Kurs anzeigen

Anleitung zur Übung

  • Zähle Wörter danach, ob es sich um eine Beschwerde handelt oder nicht.
  • Behalte die Top 20 Wörter je nachdem, ob es eine Beschwerde ist oder nicht.
  • Hebe die Gruppierung auf, bevor du word als Faktor nach der Häufigkeit neu anordnest.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

word_counts <- tidy_twitter %>%
  # Count words by whether or not its a complaint
  ___(___, ___) %>%
  # Group by whether or not its a complaint
  group_by(___) %>%
  # Keep the top 20 words
  ___(___, ___) %>%
  # Ungroup before reordering word as a factor by the count
  ___() %>%
  ___(word2 = ___(___, ___))
Code bearbeiten und ausführen