Tellen per product en herschikken
tidy_twitter is getokenized en stopwoorden, inclusief aangepaste stopwoorden, zijn verwijderd. Je wilt de verschillen in woordfrequenties visualiseren op basis van klachten en niet-klachten.
Deze oefening maakt deel uit van de cursus
Introductie tot tekstanalyse in R
Oefeninstructies
- Tel woorden naar gelang het wel of geen klacht is.
- Behoud de top 20 woorden naar gelang het wel of geen klacht is.
- Haal de groepering weg voordat je
wordals factor herschikt op basis van de telling.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
word_counts <- tidy_twitter %>%
# Count words by whether or not its a complaint
___(___, ___) %>%
# Group by whether or not its a complaint
group_by(___) %>%
# Keep the top 20 words
___(___, ___) %>%
# Ungroup before reordering word as a factor by the count
___() %>%
___(word2 = ___(___, ___))