1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Khai phá văn bản với Bag-of-Words trong R

Connected

Bài tập

Tùy chỉnh giao diện dendrogram

Bạn đã tạo được một dendrogram… nhưng trông chưa thật sự bắt mắt như bạn kỳ vọng!

Gói dendextend có thể hỗ trợ người xem bằng cách tô màu các nhánh và vẽ viền các cụm. dendextend được thiết kế để hoạt động với các đối tượng dendrogram, nên bạn sẽ phải chuyển đổi phân cụm phân cấp từ hclust bằng as.dendrogram().

Một cách hay để rà soát các thuật ngữ trong dendrogram là dùng hàm labels(). Hàm này sẽ in ra tất cả các thuật ngữ của dendrogram. Để làm nổi bật các nhánh cụ thể, dùng branches_attr_by_labels(). Đầu tiên, truyền vào đối tượng dendrogram, sau đó là một vector các thuật ngữ như c("data", "camp"). Cuối cùng, thêm một màu như "blue".

Sau khi vẽ biểu đồ, bạn có thể đánh dấu các cụm bằng rect.dendrogram(). Hàm này thêm các hình chữ nhật cho mỗi cụm. Đối số đầu tiên của rect.dendrogram() là dendrogram, theo sau là số cụm (k). Bạn cũng có thể truyền đối số border để chỉ định màu của viền các hình chữ nhật (ví dụ "green").

Hướng dẫn

100 XP

Gói dendextend đã được nạp sẵn cho bạn, và một đối tượng phân cụm phân cấp, hc, đã được tạo từ tweets_dist.

  • Tạo hcd dưới dạng dendrogram bằng cách dùng as.dendrogram() trên hc.
  • In labels của hcd ra console.
  • Dùng branches_attr_by_labels() để tô màu các nhánh. Truyền vào ba đối số: đối tượng hcd, c("marvin", "gaye"), và màu "red". Gán kết quả cho hcd_colored.
  • plot() dendrogram hcd_colored với tiêu đề "Better Dendrogram", được thêm bằng đối số main.
  • Thêm các hình chữ nhật vào biểu đồ bằng rect.dendrogram(). Chỉ định k = 2 cụm và màu border là "grey50".