1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Phân tích Văn bản bằng R

Connected

Bài tập

Dữ liệu tweet về hãng hàng không

Data frame twitter_data có hơn 7.000 tweet về các hãng hàng không. Các tweet đã được phân loại là khiếu nại hoặc không khiếu nại trong cột complaint_label. Hãy xem có bao nhiêu tweet là khiếu nại.

Lưu ý: đây là dữ liệu thật từ Twitter nên có thể chứa từ ngữ thô tục hoặc nội dung gây khó chịu (áp dụng cho bài này và các bài sau cũng dùng dữ liệu Twitter thật).

Hướng dẫn

100 XP
  • Tải gói tidyverse.
  • Xem kích thước và nội dung dữ liệu bằng cách in twitter_data.
  • Lọc twitter_data để chỉ còn các tweet khiếu nại. Có bao nhiêu khiếu nại trong dữ liệu?