1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Xử lý Ngôn ngữ Tự nhiên với R

Connected

Bài tập

bộ từ vựng (lexicon) của tidytext

Trước khi bắt đầu áp dụng phân tích cảm xúc cho văn bản, điều quan trọng là bạn phải hiểu các bộ từ vựng (lexicon) được dùng để hỗ trợ phân tích. Mỗi lexicon có lợi thế riêng khi dùng đúng ngữ cảnh. Trước khi chạy bất kỳ phân tích nào, bạn cần quyết định kiểu cảm xúc mà bạn muốn trích xuất từ văn bản hiện có.

Trong bài tập này, bạn sẽ khám phá ba lexicon khác nhau được cung cấp trong bộ dữ liệu cảm xúc của tidytext.

Hướng dẫn 1/3

undefined XP
  • 1
    • In ra lexicon bing và đếm các giá trị khác nhau của cột sentiment.
  • 2
    • In ra lexicon nrc và đếm các giá trị khác nhau của cột sentiment.
  • 3
    • In ra lexicon afinn và đếm các giá trị khác nhau của cột score.