Tokenisasi dan penghitungan
Jelajahi konten cuitan maskapai dalam twitter_data melalui hitungan kata. Konten tiap cuitan berada di kolom tweet_text.
Latihan ini adalah bagian dari kursus
Pengantar Analisis Teks di R
Petunjuk latihan
- Muat paket tidyverse dan tidytext.
- Lakukan tokenisasi pada cuitan di kolom
tweet_text. - Hitung frekuensi kata menggunakan teks yang sudah ditokenisasi.
- Urutkan hasil hitungan secara menurun.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load the tidyverse and tidytext packages
___(___)
___(___)
tidy_twitter <- twitter_data %>%
# Tokenize the twitter data
___(word, ___)
tidy_twitter %>%
# Compute word counts
___(___) %>%
# Arrange the counts in descending order
___(___)