IniziaInizia gratis

Tokenizzazione e conteggio

Esplora il contenuto dei tweet delle compagnie aeree in twitter_data tramite il conteggio delle parole. Il contenuto di ogni tweet è nella colonna tweet_text.

Questo esercizio fa parte del corso

Introduzione all'analisi del testo in R

Visualizza il corso

Istruzioni dell'esercizio

  • Carica i pacchetti tidyverse e tidytext.
  • Tokenizza i tweet nella colonna tweet_text.
  • Calcola il conteggio delle parole usando il testo tokenizzato.
  • Ordina i conteggi in ordine decrescente.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Load the tidyverse and tidytext packages
___(___)
___(___)

tidy_twitter <- twitter_data %>% 
  # Tokenize the twitter data
  ___(word, ___) 

tidy_twitter %>% 
  # Compute word counts
  ___(___) %>% 
  # Arrange the counts in descending order
  ___(___)
Modifica ed esegui il codice