Word cloud sederhana

Pada titik ini, Anda sudah terlalu banyak minum kopi. Selain itu, melihat kata-kata teratas seperti "shop", "morning", dan "drinking" serta yang lainnya belum terlalu memberikan wawasan.

Sebagai perayaan karena sudah sejauh ini, mari kita coba satu kumpulan lagi berisi 1000 tweet. Untuk saat ini, Anda belum tahu apa kesamaan mereka, tetapi mari kita lihat apakah Anda bisa menebaknya menggunakan word cloud. Nilai frekuensi term tweet sudah dimuat di workspace Anda.

Word cloud adalah visualisasi dari term. Dalam word cloud, ukuran sering diskalakan berdasarkan frekuensi, dan dalam beberapa kasus, warna dapat menunjukkan pengukuran lain. Untuk sekarang, kita buat sederhana: ukuran terkait dengan frekuensi kata individual, dan kita hanya memilih satu warna.

Seperti yang Anda lihat di video, fungsi wordcloud() bekerja seperti ini:

wordcloud(words, frequencies, max.words = 500, colors = "blue")

Analisis text mining sering kali menyertakan word cloud sederhana. Bahkan, mungkin terlalu sering digunakan, tetapi tetap berguna untuk memahami sekilas sebuah kumpulan teks!

term_frequency sudah dimuat ke dalam workspace Anda.

Latihan ini merupakan bagian dari kursus

Text Mining dengan Bag-of-Words di R

Lihat Kursus

Instruksi latihan

Muat package wordcloud.
Cetak 10 entri pertama di term_frequency.
Ekstrak term menggunakan names() pada term_frequency. Beri nama vektor string tersebut terms_vec.
Buat wordcloud() dengan terms_vec sebagai kata dan term_frequency sebagai nilainya. Tambahkan parameter max.words = 50 dan colors = "red".

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Load wordcloud package


# Print the first 10 entries in term_frequency


# Vector of terms


# Create a word cloud for the values in word_freqs

Edit dan Jalankan Kode