1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Phân tích cảm xúc trong R

Connected

Exercises

Khảo sát nhanh độ phân cực cơ bản

Khi bắt đầu một dự án phân tích cảm xúc, đôi khi chạy nhanh polarity() sẽ giúp bạn đặt kỳ vọng hoặc tìm hiểu vấn đề. Trong bài này (để tiết kiệm thời gian), bạn sẽ áp dụng polarity() cho một phần của vector comments trong khi đối tượng polarity lớn hơn đã được nạp sẵn ở nền.

Với biểu đồ mật độ kernel, bạn sẽ thấy các đánh giá không tập trung ở 0. Thường có hai nguyên nhân dẫn đến hiện tượng “lạm phát điểm” cảm xúc này. Thứ nhất, chuẩn mực xã hội có thể khiến người trả lời chọn cách diễn đạt tích cực thay vì trung tính. Dĩ nhiên, điều này phụ thuộc vào từng kênh. Những kênh hay châm biếm như e-sports hoặc bài đăng mạng xã hội có thể lệch âm, dẫn đến “giảm phát.” Mỗi kênh có kỳ vọng khác nhau. Lý do thứ hai có thể là “cảm xúc dựa trên đặc trưng” (feature-based sentiment). Trong một số đánh giá, tác giả có thể viết “the bed was comfortable and nice but the kitchen was dirty and gross.” Cảm xúc của dạng đánh giá này bao trùm nhiều đặc trưng cùng lúc, do đó có thể làm lệch điểm trung bình.

Ở bài sau bạn sẽ điều chỉnh hiện tượng “lạm phát điểm”, còn ở đây hãy khám phá các đánh giá mà không có thay đổi nào.

คำแนะนำ

100 XP
  • Tạo practice_pol bằng polarity() trên 6 đánh giá đầu tiên như bos_reviews$comments[1:6]
  • Xem đối tượng polarity trả về bằng cách gọi practice_pol.
  • Gọi summary() trên practice_pol$all$polarity - thao tác này sẽ truy cập độ phân cực tổng thể cho cả 6 bình luận.
  • Chúng tôi cũng đã nạp sẵn một đối tượng polarity lớn hơn cho toàn bộ 1000 bình luận, tên là bos_pol. Bây giờ hãy áp dụng summary() cho phần tử danh sách đúng để trả về tất cả các điểm polarity của bos_pol.
  • Mã mẫu đã có sẵn một biểu đồ cột và biểu đồ mật độ kernel gần như sẵn sàng để in. Bạn cần nhập data frame đại diện cho tất cả điểm số. Gợi ý: ở bước trước, polarity là một cột của data frame này.