1. 학습
  2. /
  3. 강의
  4. /
  5. Phân tích cảm xúc trong R

Connected

연습 문제

Kết thúc buồn? Cực tính theo trình tự thời gian

Đôi khi bạn muốn theo dõi cảm xúc theo thời gian. Ví dụ, trong một chiến dịch quảng cáo, bạn có thể theo dõi cảm nhận về thương hiệu để xem hiệu ứng của chiến dịch. Bạn đã thấy vài ví dụ ở cuối chương trước.

Trong bài tập này, bạn sẽ ôn lại quy trình khám phá cảm xúc theo thời gian bằng tiểu thuyết Moby Dick. Có thể kỳ vọng rằng những khoảnh khắc vui vẻ trong sách sẽ có nhiều từ tích cực hơn tiêu cực. Ngược lại, những đoạn tối tăm và cái kết buồn sẽ dùng nhiều ngôn ngữ tiêu cực hơn. Bạn cũng sẽ thấy vài mẹo để làm cho chuỗi thời gian cảm xúc của mình trực quan và bắt mắt hơn.

Hãy nhớ lại quy trình:

  1. Inner join văn bản với từ điển theo từng từ.
  2. Đếm số lần xuất hiện các cảm xúc theo từng dòng.
  3. Tái cấu trúc dữ liệu để mỗi cảm xúc có một cột riêng.
  4. (Tùy thuộc vào từ điển) Tính cực tính bằng điểm tích cực trừ điểm tiêu cực.
  5. Vẽ chuỗi thời gian của cực tính.

Bài tập này sẽ trông quen thuộc: nó mở rộng từ Bing tidy polarity: Call me Ishmael (với ggplot2)!

지침 1/2

undefined XP
    1
    2
  • inner_join() phiên bản tidy đã được nạp sẵn của Moby Dick, moby, với từ điển bing.
    • Join theo cột "term" trong văn bản và cột "word" trong từ điển.
  • Đếm theo sentiment và index.
  • Tái cấu trúc để mỗi cảm xúc có cột riêng bằng pivot_wider() với:
    • names_from = sentiment tham chiếu cột sentiment
    • values_from = n lấy giá trị từ cột n
    • values_fill = 0 để điền NA thành 0
  • Dùng mutate() thêm hai cột: polarity và line_number.
    • Đặt polarity bằng điểm tích cực trừ điểm tiêu cực.
    • Đặt line_number bằng số thứ tự dòng với hàm row_number().