1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích cảm xúc trong R

Connected

Bài tập

LOL, bài này hay dã man

Ngay cả khi định luật Zipf vẫn đúng, bạn vẫn cần điều chỉnh các từ điển cảm xúc (lexicon) để phù hợp với nguồn văn bản (ví dụ: twitter so với văn bản pháp lý) hoặc đặc điểm nhân khẩu học của tác giả (thiếu niên so với người lớn tuổi). Bài tập này minh họa các thành phần tường minh của polarity() để bạn có thể thay đổi khi cần.

Trong bài hát "Lol :)" của Trey Songz có câu "LOL smiley face, LOL smiley face." Ở polarity() cơ bản, "LOL" không được định nghĩa là tích cực. Tuy nhiên, "LOL" là viết tắt của "Laugh Out Loud" (cười lớn) và nên được xem là tích cực. Vì vậy, bạn cần điều chỉnh lexicon cho phù hợp với ngữ cảnh văn bản, bao gồm cả tiếng lóng văn hóa đại chúng. Nếu phân tích của bạn chứa văn bản từ một kênh cụ thể ("LOL" trên Twitter), địa phương (Boston có cụm "Wicked Good"), hoặc nhóm tuổi (thiếu niên dùng "sick" theo nghĩa tích cực) thì nhiều khả năng bạn sẽ phải điều chỉnh lexicon.

Trong bài này bạn chưa điều chỉnh subjectivity lexicon hay các từ điển của qdap chứa valence shifter. Thay vào đó bạn sẽ xem các đối tượng data frame từ vựng hiện có để có thể thay đổi ở bài tiếp theo.

Chúng tôi đã tạo text chứa hai đoạn trích từ lời bài hát "Crazy in Love" của Beyoncé để bạn thực hành.

Hướng dẫn 1/2

undefined XP
    1
    2
  • In key.pol để xem một phần các từ mang tính chủ quan và giá trị của chúng.
  • Xem negation.words được định nghĩa sẵn để in ra tất cả các từ phủ định.
  • Bây giờ in amplification.words để xem các từ làm tăng giá trị trong lexicon.
  • Kiểm tra deamplification.words để in các từ làm giảm giá trị trong lexicon.
  • Gọi text để xem đoạn hội thoại.