1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích cảm xúc trong R

Connected

Bài tập

Đánh giá mức độ nỗ lực của tác giả

Thường thì tác giả sẽ dùng nhiều từ hơn khi họ có cảm xúc mạnh. Ví dụ, một hành khách hàng không tức giận có thể để lại bài đánh giá dài hơn khi họ cho rằng dịch vụ tệ. Ngược lại, một hành khách ít cảm xúc hơn có thể không muốn dành nhiều thời gian để viết đánh giá. Các bài đánh giá dài có thể làm tăng cảm nhận về cảm xúc tổng thể vì khi độ dài tăng lên, chúng sẽ chứa nhiều ngôn từ tích cực hoặc tiêu cực hơn. Bài tập mã này giúp bạn xem xét mối liên hệ giữa nỗ lực và cảm xúc.

Trong bài tập này, bạn sẽ trực quan hóa mối quan hệ giữa nỗ lực và cảm xúc. Hãy nhớ rằng tibble đánh giá chỗ thuê của bạn có một id và mỗi hàng đại diện cho một từ. Do đó, chỉ cần count() theo id sẽ cho biết số từ được dùng trong mỗi bài đánh giá. Sau đó, bạn sẽ nối bản tóm tắt này với dữ liệu tích cực và tiêu cực. Cuối cùng, bạn sẽ tạo biểu đồ scatter để trực quan hóa độ dài bài đánh giá của tác giả và mối quan hệ của nó với polarity.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Tính thước đo nỗ lực bằng cách đếm theo id.
  • Thực hiện inner join với polarity của mỗi bài đánh giá, pos_neg.
  • Dùng mutate để thêm cột pol. Sử dụng ifelse() để đặt pol là "Positive" nếu polarity lớn hơn hoặc bằng không, ngược lại là "Negative".