1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Xử lý Ngôn ngữ Tự nhiên với R

Connected

Bài tập

Rà soát kết quả LDA

Bạn đã xây dựng một mô hình chủ đề, napoleon_model, với 5 chủ đề cho các câu trong cuốn Animal Farm có nhắc đến nhân vật chính Napoleon. Bạn đã mời 5 tác giả địa phương xem xét các từ và câu hàng đầu cho từng chủ đề, và họ đã cung cấp chủ đề (theme) cho mỗi topic.

Để hoàn thiện kết quả, hãy chuẩn bị một số thống kê tóm tắt về các chủ đề. Bạn sẽ trình bày các giá trị tóm tắt này cùng với các theme cho sếp xem xét.

Hướng dẫn

100 XP
  • Trích xuất ma trận gamma từ mô hình chủ đề napoleon_model.
  • Sử dụng các hàm của dplyr để tạo một tibble về topic đứng đầu trong mỗi câu, gọi là grouped_gammas.
  • Dùng grouped_gammas để đếm số câu phù hợp nhất với mỗi topic.
  • Dùng grouped_gammas và tính giá trị gamma trung bình cho mỗi topic.