Tokenizzazione e conteggio
Esplora il contenuto dei tweet delle compagnie aeree in twitter_data tramite il conteggio delle parole. Il contenuto di ogni tweet è nella colonna tweet_text.
Questo esercizio fa parte del corso
Introduzione all'analisi del testo in R
Istruzioni dell'esercizio
- Carica i pacchetti tidyverse e tidytext.
- Tokenizza i tweet nella colonna
tweet_text. - Calcola il conteggio delle parole usando il testo tokenizzato.
- Ordina i conteggi in ordine decrescente.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load the tidyverse and tidytext packages
___(___)
___(___)
tidy_twitter <- twitter_data %>%
# Tokenize the twitter data
___(word, ___)
tidy_twitter %>%
# Compute word counts
___(___) %>%
# Arrange the counts in descending order
___(___)