dendrogram amzn_cons
Tampaknya ada indikasi kuat jam kerja yang panjang dan keseimbangan kerja-hidup yang buruk dalam ulasan. Sebagai teknik pengelompokan sederhana, Anda memutuskan untuk melakukan klaster hierarkis dan membuat dendrogram untuk melihat seberapa terkait frasa-frasa ini.
Latihan ini adalah bagian dari kursus
Text Mining dengan Bag-of-Words di R
Petunjuk latihan
- Buat
amzn_c_tdmsebagaiTermDocumentMatrixmenggunakanamzn_cons_corpdengancontrol = list(tokenize = tokenizer). - Cetak
amzn_c_tdmke konsol. - Buat
amzn_c_tdm2dengan menerapkan fungsiremoveSparseTerms()padaamzn_c_tdmdengan argumensparsebernilai.993. - Buat
hc, objek klaster hierarkis dengan menaruh matriks jarakdist(amzn_c_tdm2)di dalam fungsihclust(). Pastikan juga meneruskanmethod = "complete"ke fungsihclust(). - Plot
hcuntuk melihat bigram yang terklaster dan memahami bagaimana konsep dalam bagian cons Amazon dapat membawa Anda pada sebuah kesimpulan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create amzn_c_tdm
___ <- ___(
___,
___
)
# Print amzn_c_tdm to the console
___
# Create amzn_c_tdm2 by removing sparse terms
___ <- ___
# Create hc as a cluster of distance values
___ <- ___(___,
___)
# Produce a plot of hc
___