Teaser: pengelompokan kata sederhana
Di bab berikutnya, kita membahas beberapa topik text mining yang beragam (namun sangat penting), termasuk:
- Pembobotan TDM/DTM
- Menangani kelangkaan (sparsity) TDM/DTM
- Menangkap metadata
- Pengelompokan kata sederhana untuk topik
- Analisis pada lebih dari satu kata
Untuk sekarang, mari kita buat visual baru bernama dendrogram dari coffee_tweets. Bab berikutnya akan menjelaskannya secara mendetail.
Latihan ini merupakan bagian dari kursus
Text Mining dengan Bag-of-Words di R
Instruksi latihan
Objek pengelompokan hierarkis, hc, telah dibuat untuk Anda dari kumpulan tweet tentang kopi.
Buat sebuah dendrogram dengan menggunakan plot() pada hc.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Plot a dendrogram
___