MulaiMulai sekarang secara gratis

Tokenisasi dan penghitungan

Jelajahi konten cuitan maskapai dalam twitter_data melalui hitungan kata. Konten tiap cuitan berada di kolom tweet_text.

Latihan ini adalah bagian dari kursus

Pengantar Analisis Teks di R

Lihat Kursus

Petunjuk latihan

  • Muat paket tidyverse dan tidytext.
  • Lakukan tokenisasi pada cuitan di kolom tweet_text.
  • Hitung frekuensi kata menggunakan teks yang sudah ditokenisasi.
  • Urutkan hasil hitungan secara menurun.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Load the tidyverse and tidytext packages
___(___)
___(___)

tidy_twitter <- twitter_data %>% 
  # Tokenize the twitter data
  ___(word, ___) 

tidy_twitter %>% 
  # Compute word counts
  ___(___) %>% 
  # Arrange the counts in descending order
  ___(___)
Edit dan Jalankan Kode