1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Khai phá văn bản với Bag-of-Words trong R

Connected

Bài tập

Tổ chức văn bản

Hướng dẫn 1/2

undefined XP
  • 1
    • Áp dụng qdap_clean() lên amzn_pros, gán vào qdap_cleaned_amzn_pros.
    • Tạo một nguồn vector (VectorSource()) từ qdap_cleaned_amzn_pros, sau đó chuyển thành một volatile corpus (VCorpus()), gán vào amzn_p_corp.
    • Tạo amzn_pros_corp bằng cách áp dụng tm_clean() lên amzn_p_corp.
  • 2
    • Áp dụng qdap_clean() lên amzn_cons, gán vào qdap_cleaned_amzn_cons.
    • Tạo một nguồn vector từ qdap_cleaned_amzn_cons, sau đó chuyển thành một volatile corpus, gán vào amzn_c_corp.
    • Tạo amzn_cons_corp bằng cách áp dụng tm_clean() lên amzn_c_corp.