1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Khai phá văn bản với Bag-of-Words trong R

Connected

Bài tập

Cage match, phần 2! Đánh giá tiêu cực

Ở cả hai tổ chức, mọi người đều nhắc đến "culture" và "smart people", nên có một số điểm tích cực tương đồng giữa hai công ty. Tuy nhiên, với biểu đồ hình kim tự tháp, bạn có thể bắt đầu suy ra mức độ nổi trội của các yếu tố tích cực trong môi trường làm việc.

Giờ bạn sẽ chuyển sang các đánh giá tiêu cực và tạo cùng một kiểu trực quan. Lần này bạn đã có sẵn dataframe common_words trong không gian làm việc. Tuy nhiên, các bigram phổ biến trong bài này đến từ các đánh giá nhân viên mang tính tiêu cực.

Hướng dẫn

100 XP
  • Dùng slice_max() trên common_words để lấy 5 bigram hàng đầu dựa trên cột diff. Kết quả của đối tượng mới sẽ được in ra console của bạn.
  • Tạo pyramid.plot(). Truyền vào top5_df$AmazonNeg, top5_df$GoogleNeg, và labels = top5_df$terms. Để nhãn rõ hơn, đặt
    • gap là 12.
    • top.labels là c("Amzn", "Neg Words", "Goog")

Các đối số main và unit đã được thiết lập sẵn cho bạn.