1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích cảm xúc trong R

Connected

Bài tập

Bing tidy polarity: Đếm & pivot con cá voi trắng

Trong bài này, bạn sẽ áp dụng một inner_join() khác với lexicon "bing".

Sau đó, bạn sẽ thao tác kết quả bằng cả count() từ dplyr và pivot_wider() từ tidyr để khai thác thông tin văn bản.

Hàm pivot_wider() trải dữ liệu ra nhiều cột. Trong trường hợp này, sentiment và các giá trị n tương ứng biểu thị tần suất các từ tích cực hoặc tiêu cực cho mỗi dòng. Dùng pivot_wider() sẽ biến đổi dữ liệu để mỗi hàng có cả giá trị positive và negative, kể cả khi là 0.

Hướng dẫn

100 XP

Trong bài này, phiên R của bạn đã có m_dick_tidy chứa cuốn sách Moby Dick và bing, chứa lexicon tương tự bài trước.

  • Thực hiện inner_join() giữa m_dick_tidy và bing.
    • Như trước, nối cột "term" trong m_dick_tidy với cột "word" trong lexicon.
    • Gọi đối tượng mới là moby_lex_words.
  • Tạo cột index, bằng với as.numeric() áp dụng cho document. Thực hiện bên trong mutate() của tidyverse.
  • Tạo moby_count bằng cách chuyển tiếp moby_lex_words vào count(), truyền vào sentiment, index.
  • Tạo moby_wide bằng cách pipe moby_count sang pivot_wider() với names_from bằng cột sentiment, values_from bằng cột n và điền giá trị bằng values_fill = 0.
  • arrange là pipe tiếp theo để sắp xếp các hàng theo giá trị index