MulaiMulai sekarang secara gratis

Estetika dendrogram

Jadi Anda sudah membuat dendrogram… tetapi tidak semenarik yang Anda harapkan!

Paket dendextend dapat membantu audiens Anda dengan mewarnai cabang dan memberi garis tepi pada klaster. dendextend dirancang untuk bekerja pada objek dendrogram, sehingga Anda harus mengubah klaster hierarkis dari hclust menggunakan as.dendrogram().

Cara yang baik untuk meninjau istilah dalam dendrogram Anda adalah dengan fungsi labels(). Fungsi ini akan mencetak semua istilah dalam dendrogram. Untuk menyorot cabang tertentu, gunakan branches_attr_by_labels(). Pertama, masukkan objek dendrogram, kemudian sebuah vektor istilah seperti pada c("data", "camp"). Terakhir, tambahkan warna seperti "blue".

Setelah Anda membuat plot, Anda dapat menandai klaster dengan rect.dendrogram(). Ini menambahkan persegi panjang untuk setiap klaster. Argumen pertama untuk rect.dendrogram() adalah dendrogram, diikuti oleh jumlah klaster (k). Anda juga dapat menambahkan argumen border untuk menentukan warna garis tepi persegi panjang tersebut (misalnya "green").

Latihan ini adalah bagian dari kursus

Text Mining dengan Bag-of-Words di R

Lihat Kursus

Petunjuk latihan

Paket dendextend telah dimuat untuk Anda, dan sebuah objek klaster hierarkis, hc, telah dibuat dari tweets_dist.

  • Buat hcd sebagai dendrogram menggunakan as.dendrogram() pada hc.
  • Cetak labels dari hcd ke konsol.
  • Gunakan branches_attr_by_labels() untuk memberi warna pada cabang. Berikan tiga argumen: objek hcd, c("marvin", "gaye"), dan warna "red". Simpan sebagai hcd_colored.
  • plot() dendrogram hcd_colored dengan judul "Better Dendrogram", ditambahkan menggunakan argumen main.
  • Tambahkan persegi panjang pada plot menggunakan rect.dendrogram(). Tentukan k = 2 klaster dan warna border "grey50".

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create hcd
___ <- ___(___)

# Print the labels in hcd
___(___)

# Change the branch color to red for "marvin" and "gaye"
___ <- ___(___, ___, ___)

# Plot hcd_colored
___(___, ___)

# Add cluster rectangles
___(___, ___, ___)
Edit dan Jalankan Kode