Word cloud sederhana
Pada titik ini, Anda sudah terlalu banyak minum kopi. Selain itu, melihat kata-kata teratas seperti "shop", "morning", dan "drinking" serta yang lainnya belum terlalu memberikan wawasan.
Sebagai perayaan karena sudah sejauh ini, mari kita coba satu kumpulan lagi berisi 1000 tweet. Untuk saat ini, Anda belum tahu apa kesamaan mereka, tetapi mari kita lihat apakah Anda bisa menebaknya menggunakan word cloud. Nilai frekuensi term tweet sudah dimuat di workspace Anda.
Word cloud adalah visualisasi dari term. Dalam word cloud, ukuran sering diskalakan berdasarkan frekuensi, dan dalam beberapa kasus, warna dapat menunjukkan pengukuran lain. Untuk sekarang, kita buat sederhana: ukuran terkait dengan frekuensi kata individual, dan kita hanya memilih satu warna.
Seperti yang Anda lihat di video, fungsi wordcloud() bekerja seperti ini:
wordcloud(words, frequencies, max.words = 500, colors = "blue")
Analisis text mining sering kali menyertakan word cloud sederhana. Bahkan, mungkin terlalu sering digunakan, tetapi tetap berguna untuk memahami sekilas sebuah kumpulan teks!
term_frequency sudah dimuat ke dalam workspace Anda.
Latihan ini adalah bagian dari kursus
Text Mining dengan Bag-of-Words di R
Petunjuk latihan
- Muat package
wordcloud. - Cetak 10 entri pertama di
term_frequency. - Ekstrak term menggunakan
names()padaterm_frequency. Beri nama vektor string tersebutterms_vec. - Buat
wordcloud()denganterms_vecsebagai kata danterm_frequencysebagai nilainya. Tambahkan parametermax.words = 50dancolors = "red".
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load wordcloud package
# Print the first 10 entries in term_frequency
# Vector of terms
# Create a word cloud for the values in word_freqs