1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Xử lý Ngôn ngữ Tự nhiên với R

Connected

Bài tập

Gán chủ đề cho tài liệu

Việc tạo mô hình LDA sẽ vô nghĩa nếu bạn không thể diễn giải và sử dụng kết quả. Bạn được cung cấp kết quả chạy mô hình LDA, sentence_lda, trên một tập câu, pig_sentences. Bạn cần khám phá cả hai ma trận: beta (các từ hàng đầu theo chủ đề) và gamma (các chủ đề nổi bật theo tài liệu) để hiểu đầy đủ kết quả của bất kỳ phân tích LDA nào.

Dựa trên những gì bạn biết về hai ma trận này, hãy trích xuất kết quả cho một chủ đề cụ thể và xem liệu đầu ra có khớp với kỳ vọng không.

Hướng dẫn

100 XP
  • Tạo một tibble cho cả hai ma trận beta và gamma.
  • Khám phá chủ đề 5 bằng cách xem các từ hàng đầu của chủ đề 5, đồng thời sắp xếp kết quả theo giá trị beta giảm dần.
  • Khám phá chủ đề 5 bằng cách xem những câu nào phù hợp nhất với chủ đề 5, đồng thời sắp xếp kết quả theo giá trị gamma giảm dần.