Évaluer une DTM comme une matrice
Entraînons‑nous à convertir des données tidy en DTM, puis à évaluer la DTM en la traitant comme une matrice.
Dans cet exercice, vous allez créer à nouveau une DTM, mais avec un sous‑ensemble beaucoup plus petit des données Twitter (tidy_twitter_subset).
Cet exercice fait partie du cours
Introduction à l’analyse de texte en R
Instructions
- Convertissez les occurrences de mots par tweet en DTM et affectez‑la à
dtm_twitter. - Transformez
dtm_twitteren une matrice appeléematrix_twitter. - Affichez les lignes 1 à 5 et les colonnes 90 à 95.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Assign the DTM to dtm_twitter
dtm_twitter <- tidy_twitter_subset %>%
count(word, tweet_id) %>%
# Cast the word counts by tweet into a DTM
___(___)
# Coerce dtm_twitter into a matrix called matrix_twitter
___ <- ___(___)
# Print rows 1 through 5 and columns 90 through 95
___