Istilah sering muncul dengan qdap

Jika Anda tidak masalah melepas sebagian kendali atas langkah prapemrosesan yang tepat, cara cepat untuk mendapatkan istilah yang sering muncul adalah dengan freq_terms() dari qdap.

Fungsi ini menerima variabel teks, yang dalam kasus kita adalah vektor tweets$text. Anda dapat menentukan jumlah istilah teratas yang akan ditampilkan dengan argumen top, vektor stop word yang akan dihapus dengan argumen stopwords, serta panjang karakter minimum suatu kata agar disertakan dengan argumen at.least. qdap memiliki daftar stop word sendiri yang berbeda dari milik tm. Latihan kita akan menunjukkan cara menggunakan keduanya dan membandingkan hasilnya.

Membuat plot dasar dari hasilnya itu mudah. Cukup panggil plot() pada objek freq_terms().

Latihan ini merupakan bagian dari kursus

Text Mining dengan Bag-of-Words di R

Lihat Kursus

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Create frequency
frequency <- ___(
  ___, 
  top = ___, 
  at.least = ___, 
  stopwords = ___
)

# Make a frequency bar chart

Edit dan Jalankan Kode