Memvisualisasikan jaringan kata
Cara lain untuk melihat keterkaitan kata adalah dengan memperlakukannya sebagai sebuah jaringan, mirip dengan jejaring sosial. Jaringan kata menampilkan asosiasi dan kekompakan istilah. Catatan penting: visual ini bisa menjadi sangat padat dan sulit ditafsirkan secara visual.
Dalam grafik jaringan, lingkaran disebut node dan merepresentasikan istilah individual, sedangkan garis yang menghubungkan lingkaran disebut edge dan merepresentasikan hubungan antaristilah.
Untuk penambang teks yang “kelebihan kafein”, qdap menyediakan jalan pintas untuk membuat jaringan kata. Fungsi word_network_plot() dan word_associate() sama-sama memudahkan pembuatan jaringan kata!
Kode contoh membangun jaringan kata untuk kata-kata yang terkait dengan "Marvin".
Latihan ini adalah bagian dari kursus
Text Mining dengan Bag-of-Words di R
Petunjuk latihan
Perbarui kode plotting word_associate() agar bekerja dengan data kopi.
- Ubah vektornya menjadi
coffee_tweets$text. - Ubah string pencocokan menjadi
"barista". - Ganti
"chardonnay"dengan"coffee"juga di stopwords. - Ubah judul menjadi
"Barista Coffee Tweet Associations"pada kode contoh untuk plot.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Word association
word_associate(chardonnay_tweets$text, match.string = "marvin",
stopwords = c(Top200Words, "chardonnay", "amp"),
network.plot = TRUE, cloud.colors = c("gray85", "darkred"))
# Add title
title(main = "Chardonnay Tweets Associated with Marvin")