Creare una DTM
Crea una document term matrix (DTM) utilizzando i nostri dati tidy_twitter. In questo caso, ogni tweet è considerato un documento. Stampa tidy_twitter nella console per verificare i nomi delle colonne.
Questo esercizio fa parte del corso
Introduzione all'analisi del testo in R
Istruzioni dell'esercizio
- Parti dai dati di Twitter in formato tidy.
- Conta ogni parola usata in ciascun tweet.
- Usa i conteggi delle parole per tweet per creare una DTM.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Start with the tidied Twitter data
___ %>%
# Count each word used in each tweet
___(word, ___) %>%
# Use the word counts by tweet to create a DTM
cast_dtm(___, word, n)