1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Khai phá văn bản với Bag-of-Words trong R

Connected

Bài tập

Cải thiện màu sắc của word cloud

Đến giờ, bạn mới chỉ chọn một màu dạng mã thập lục phân để tạo word cloud. Bạn có thể dễ dàng làm cho word cloud trông hấp dẫn hơn. Thay vì dùng #AD1DA5 trong đoạn mã dưới đây, bạn có thể chỉ định một vector màu để làm nổi bật một số từ nhất định hoặc để phù hợp với một bảng màu sẵn có.

wordcloud(chardonnay_freqs$term, 
          chardonnay_freqs$num, 
          max.words = 100, 
          colors = "#AD1DA5")

Để thay đổi đối số colors của hàm wordcloud(), bạn có thể dùng một vector màu có tên như c("chartreuse", "cornflowerblue", "darkorange"). Hàm colors() sẽ liệt kê toàn bộ 657 màu có tên. Bạn cũng có thể dùng PDF này làm tài liệu tham khảo.

Trong bài tập này, bạn sẽ dùng các màu "grey80", "darkgoldenrod1" và "tomato". Đây là một bảng màu khởi đầu tốt để làm nổi bật thuật ngữ vì "tomato" nổi bật hơn "grey80". Thực hành tốt là bắt đầu với ba màu có độ rực tăng dần. Cách này sẽ tự nhiên chia tần suất thuật ngữ thành "thấp", "trung bình" và "cao" để dễ quan sát hơn.

Hướng dẫn

100 XP
  • Gọi hàm colors() để liệt kê tất cả các màu cơ bản.
  • Tạo một wordcloud() dùng chardonnay_freqs đã cho với các màu "grey80", "darkgoldenrod1" và "tomato". Bao gồm 100 thuật ngữ hàng đầu bằng max.words.