1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Khai phá văn bản với Bag-of-Words trong R

Connected

Bài tập

Trực quan hóa mạng lưới từ

Một cách khác để xem các kết nối giữa từ là coi chúng như một mạng lưới, tương tự mạng xã hội. Mạng lưới từ cho thấy sự liên kết và gắn kết giữa các thuật ngữ. Lưu ý: dạng trực quan này có thể trở nên rất dày đặc và khó diễn giải bằng mắt.

Trong đồ thị mạng, các vòng tròn được gọi là nút (nodes) và đại diện cho từng thuật ngữ, còn các đường nối giữa các vòng tròn được gọi là cạnh (edges) và biểu thị các kết nối giữa các thuật ngữ.

Với người khai phá văn bản “quá đam mê cà phê”, qdap cung cấp một lối tắt để tạo mạng lưới từ. Cả hai hàm word_network_plot() và word_associate() đều giúp việc tạo mạng lưới từ trở nên dễ dàng!

Mã mẫu dựng một mạng lưới từ cho các từ liên quan đến "Marvin".

Hướng dẫn

100 XP

Cập nhật mã vẽ word_associate() để chạy với dữ liệu coffee.

  • Đổi vector thành coffee_tweets$text.
  • Đổi chuỗi khớp thành "barista".
  • Đổi "chardonnay" thành "coffee" trong stopwords nữa.
  • Đổi tiêu đề thành "Barista Coffee Tweet Associations" trong mã mẫu của biểu đồ.