Menghitung menurut produk dan menyusun ulang urutan
tidy_twitter telah ditokenisasi dan stop word, termasuk stop word kustom, telah dihapus. Anda ingin memvisualisasikan perbedaan jumlah kata berdasarkan keluhan dan bukan keluhan.
Latihan ini adalah bagian dari kursus
Pengantar Analisis Teks di R
Petunjuk latihan
- Hitung kata berdasarkan apakah itu keluhan atau bukan.
- Pertahankan 20 kata teratas berdasarkan apakah itu keluhan atau bukan.
- Lepas pengelompokan (ungroup) sebelum menyusun ulang
wordsebagai faktor berdasarkan hitungan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
word_counts <- tidy_twitter %>%
# Count words by whether or not its a complaint
___(___, ___) %>%
# Group by whether or not its a complaint
group_by(___) %>%
# Keep the top 20 words
___(___, ___) %>%
# Ungroup before reordering word as a factor by the count
___() %>%
___(word2 = ___(___, ___))