1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích dữ liệu mạng xã hội bằng R

Connected

Bài tập

Trực quan hóa các thuật ngữ phổ biến với biểu đồ cột

Biểu đồ cột là một công cụ đơn giản nhưng phổ biến trong trực quan hóa dữ liệu.

Nó giúp tóm tắt nhanh các nhóm (category) và giá trị của chúng dưới dạng trực quan.

Trong bài tập này, bạn sẽ tạo các biểu đồ cột cho những thuật ngữ phổ biến xuất hiện trong một kho văn bản.

Kho văn bản đã được làm sạch mà bạn tạo cho "telemedicine" đã được nạp sẵn là corp_refined.

Các thư viện qdap và ggplot2 đã được nạp sẵn cho bài tập này.

Hướng dẫn 1/2

undefined XP
  • 1
    • Trích xuất tần suất thuật ngữ cho 10 từ đứng đầu.
    • Tìm các thuật ngữ có tần suất lớn hơn 60.
    • Tạo một biểu đồ cột.
  • 2
    • Trích xuất tần suất thuật ngữ cho 25 từ đứng đầu.
    • Tìm các thuật ngữ có tần suất lớn hơn 50.
    • Tạo một biểu đồ cột.