1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích dữ liệu mạng xã hội bằng R

Connected

Bài tập

Tạo một mô hình chủ đề

Topic modeling là nhiệm vụ tự động khám phá các chủ đề từ một lượng văn bản khổng lồ.

Bạn có thể tạo các mô hình chủ đề từ văn bản tweet để nhanh chóng tóm tắt lượng thông tin lớn thành các chủ đề riêng biệt và rút ra insight.

Trong bài này, bạn sẽ trích xuất các chủ đề riêng biệt từ các tweet về "Climate change".

DTM của các tweet về "Climate change" đã được nạp sẵn dưới tên dtm_climate_new.

Thư viện topicmodels đã được nạp sẵn cho bài tập này.

Hướng dẫn 1/2

undefined XP
  • 1
    • Tạo một mô hình chủ đề với 5 chủ đề từ DTM bằng Latent Dirichlet Allocation (LDA).
    • Chọn và xem 10 thuật ngữ hàng đầu trong mô hình chủ đề.
  • 2
    • Lần này, tiếp tục tạo một mô hình chủ đề với bốn chủ đề từ DTM bằng LDA.
    • Chọn và xem sáu thuật ngữ hàng đầu trong mô hình chủ đề mới này.