Een DTM maken
Maak een document-term-matrix (DTM) met onze tidy_twitter-gegevens. In dit geval geldt elke tweet als een document. Print tidy_twitter in de console om de kolomnamen te controleren.
Deze oefening maakt deel uit van de cursus
Introductie tot tekstanalyse in R
Oefeninstructies
- Begin met de opgeruimde Twitter-gegevens.
- Tel elk woord dat in elke tweet voorkomt.
- Gebruik de woordfrequenties per tweet om een DTM te maken.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Start with the tidied Twitter data
___ %>%
# Count each word used in each tweet
___(word, ___) %>%
# Use the word counts by tweet to create a DTM
cast_dtm(___, word, n)