Tokenisasi dan penghitungan
Jelajahi konten cuitan maskapai dalam twitter_data melalui hitungan kata. Konten tiap cuitan berada di kolom tweet_text.
Latihan ini merupakan bagian dari kursus
Pengantar Analisis Teks di R
Instruksi latihan
- Muat paket tidyverse dan tidytext.
- Lakukan tokenisasi pada cuitan di kolom
tweet_text. - Hitung frekuensi kata menggunakan teks yang sudah ditokenisasi.
- Urutkan hasil hitungan secara menurun.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Load the tidyverse and tidytext packages
___(___)
___(___)
tidy_twitter <- twitter_data %>%
# Tokenize the twitter data
___(word, ___)
tidy_twitter %>%
# Compute word counts
___(___) %>%
# Arrange the counts in descending order
___(___)