Istilah sering muncul dengan qdap
Jika Anda tidak masalah melepas sebagian kendali atas langkah prapemrosesan yang tepat, cara cepat untuk mendapatkan istilah yang sering muncul adalah dengan freq_terms() dari qdap.
Fungsi ini menerima variabel teks, yang dalam kasus kita adalah vektor tweets$text. Anda dapat menentukan jumlah istilah teratas yang akan ditampilkan dengan argumen top, vektor stop word yang akan dihapus dengan argumen stopwords, serta panjang karakter minimum suatu kata agar disertakan dengan argumen at.least. qdap memiliki daftar stop word sendiri yang berbeda dari milik tm. Latihan kita akan menunjukkan cara menggunakan keduanya dan membandingkan hasilnya.
Membuat plot dasar dari hasilnya itu mudah. Cukup panggil plot() pada objek freq_terms().
Latihan ini adalah bagian dari kursus
Text Mining dengan Bag-of-Words di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create frequency
frequency <- ___(
___,
top = ___,
at.least = ___,
stopwords = ___
)
# Make a frequency bar chart