1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích cảm xúc trong R

Connected

Bài tập

Đo polarity trên văn bản thực tế

Đến đây bạn đã nắm những thành phần cơ bản để đánh giá ý định tích cực hay tiêu cực trong văn bản. Hãy ghi nhớ các điểm sau để tự tin với kết quả của mình.

  • Từ điển tính chủ quan (subjectivity lexicon) là danh sách định nghĩa sẵn các từ gắn với cảm xúc hoặc cảm giác tích cực/tiêu cực.
  • Bạn không cần liệt kê mọi từ trong từ điển tính chủ quan, vì định luật Zipf mô tả cách con người biểu đạt ngôn ngữ.

Cách khởi đầu nhanh là dùng hàm polarity() có sẵn một từ điển tính chủ quan tích hợp.

Hàm này quét văn bản để nhận diện các từ có trong từ điển, rồi tạo một cụm (cluster) xung quanh từ tính chủ quan được nhận diện. Bên trong cụm, các từ đổi sắc thái (valence shifters) sẽ điều chỉnh điểm số. Đây là những từ khuếch đại hoặc phủ định ý định cảm xúc của từ tính chủ quan. Ví dụ, "well known" là tích cực trong khi "not well known" là tiêu cực. Ở đây, "not" là từ phủ định và đảo ngược ý định cảm xúc của "well known". Ngược lại, "very well known" dùng một từ khuếch đại để tăng cường ý định tích cực.

Sau đó polarity() tính điểm dựa trên các từ tính chủ quan, các từ đổi sắc thái và tổng số từ trong đoạn. Bài tập này minh họa một phép tính polarity đơn giản. Trong video tiếp theo, bạn sẽ xem bên trong cách polarity() hoạt động chi tiết hơn.

Hướng dẫn 1/2

undefined XP
    1
    2

Tính polarity() của positive vào một đối tượng mới tên pos_score. Đặt toàn bộ lời gọi trong dấu ngoặc đơn để in luôn kết quả.