Teaser: pengelompokan kata sederhana
Di bab berikutnya, kita membahas beberapa topik text mining yang beragam (namun sangat penting), termasuk:
- Pembobotan TDM/DTM
- Menangani kelangkaan (sparsity) TDM/DTM
- Menangkap metadata
- Pengelompokan kata sederhana untuk topik
- Analisis pada lebih dari satu kata
Untuk sekarang, mari kita buat visual baru bernama dendrogram dari coffee_tweets. Bab berikutnya akan menjelaskannya secara mendetail.
Latihan ini adalah bagian dari kursus
Text Mining dengan Bag-of-Words di R
Petunjuk latihan
Objek pengelompokan hierarkis, hc, telah dibuat untuk Anda dari kumpulan tweet tentang kopi.
Buat sebuah dendrogram dengan menggunakan plot() pada hc.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Plot a dendrogram
___