1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Phân tích Văn bản bằng R

Connected

Bài tập

Huấn luyện một mô hình LDA

Đến lúc chạy mô hình chủ đề (topic model) đầu tiên của bạn! Như đã thảo luận, ba đối số bổ sung của hàm LDA() rất quan trọng để chạy đúng một topic model. Lưu ý rằng chạy hàm LDA() có thể mất khoảng 10 giây. Các gói tidyverse và tidytext cùng với bộ dữ liệu tidy_twitter đã được nạp sẵn cho bạn.

Hướng dẫn

100 XP
  • Nạp gói topicmodels.
  • Chuyển (cast) số lần xuất hiện từ theo từng tweet thành một DTM.
  • Chạy LDA với 2 chủ đề (topics) và dùng Gibbs sampler.