1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Phân tích Văn bản bằng R

Connected

Bài tập

Chủ đề dưới dạng xác suất từ

lda_topics chứa các chủ đề được tạo ra từ một lần chạy LDA trên dữ liệu Twitter. Hãy nhớ rằng mỗi chủ đề là một tập hợp các xác suất của tất cả các từ xuất hiện trong kho văn bản. Ở đây, mỗi tweet là một tài liệu riêng và cột beta chứa các xác suất từ.

Hướng dẫn 1/2

undefined XP
    1
    2

In ra kết quả từ một lần chạy LDA trên dữ liệu Twitter. Kết quả được lưu trong lda_topics.