Een DTM als matrix evalueren
Laten we oefenen met het casten van onze nette data naar een DTM en de DTM evalueren door die als matrix te behandelen.
In deze oefening maak je opnieuw een DTM, maar dan met een veel kleinere subset van de Twitter-gegevens (tidy_twitter_subset).
Deze oefening maakt deel uit van de cursus
Introductie tot tekstanalyse in R
Oefeninstructies
- Cast de woordtellingen per tweet naar een DTM en wijs die toe aan
dtm_twitter. - Zet
dtm_twitterom naar een matrix met de naammatrix_twitter. - Print rijen 1 tot en met 5 en kolommen 90 tot en met 95.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Assign the DTM to dtm_twitter
dtm_twitter <- tidy_twitter_subset %>%
count(word, tweet_id) %>%
# Cast the word counts by tweet into a DTM
___(___)
# Coerce dtm_twitter into a matrix called matrix_twitter
___ <- ___(___)
# Print rows 1 through 5 and columns 90 through 95
___