Aan de slagBegin gratis

Tellen per product en herschikken

tidy_twitter is getokenized en stopwoorden, inclusief aangepaste stopwoorden, zijn verwijderd. Je wilt de verschillen in woordfrequenties visualiseren op basis van klachten en niet-klachten.

Deze oefening maakt deel uit van de cursus

Introductie tot tekstanalyse in R

Bekijk cursus

Oefeninstructies

  • Tel woorden naar gelang het wel of geen klacht is.
  • Behoud de top 20 woorden naar gelang het wel of geen klacht is.
  • Haal de groepering weg voordat je word als factor herschikt op basis van de telling.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

word_counts <- tidy_twitter %>%
  # Count words by whether or not its a complaint
  ___(___, ___) %>%
  # Group by whether or not its a complaint
  group_by(___) %>%
  # Keep the top 20 words
  ___(___, ___) %>%
  # Ungroup before reordering word as a factor by the count
  ___() %>%
  ___(word2 = ___(___, ___))
Code bewerken en uitvoeren