Memvisualisasikan jumlah kata menggunakan faktor
Saya telah menambahkan sejumlah kata henti khusus lainnya (termasuk nama maskapai) dan merapikan datanya untuk Anda. Sekarang Anda akan membuat visualisasi yang lebih baik dan memplot kata-kata yang diurutkan menurun berdasarkan jumlah kemunculan kata.
Latihan ini adalah bagian dari kursus
Pengantar Analisis Teks di R
Petunjuk latihan
- Hanya pertahankan istilah yang muncul lebih dari 100 kali dalam
non_complaints. - Ubah urutan kolom
wordsebagai faktor yang diurutkan berdasarkan jumlah kata. - Buat diagram batang menggunakan kolom kata baru bertipe faktor.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
word_counts <- tidy_twitter %>%
filter(complaint_label == "Non-Complaint") %>%
count(word) %>%
# Keep terms that occur more than 100 times
___(___) %>%
# Reorder word as an ordered factor by word counts
___(word2 = ___(___, ___))
# Plot the new word column with type factor
___(___, aes(___, ___)) +
___() +
___() +
ggtitle("Non-Complaint Word Counts")