Mulai sekarangMulai gratis

Tokenisasi dan penghitungan

Jelajahi konten cuitan maskapai dalam twitter_data melalui hitungan kata. Konten tiap cuitan berada di kolom tweet_text.

Latihan ini merupakan bagian dari kursus

Pengantar Analisis Teks di R

Lihat Kursus

Instruksi latihan

  • Muat paket tidyverse dan tidytext.
  • Lakukan tokenisasi pada cuitan di kolom tweet_text.
  • Hitung frekuensi kata menggunakan teks yang sudah ditokenisasi.
  • Urutkan hasil hitungan secara menurun.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Load the tidyverse and tidytext packages
___(___)
___(___)

tidy_twitter <- twitter_data %>% 
  # Tokenize the twitter data
  ___(word, ___) 

tidy_twitter %>% 
  # Compute word counts
  ___(___) %>% 
  # Arrange the counts in descending order
  ___(___)
Edit dan Jalankan Kode