1. Învăţa
  2. /
  3. Courses
  4. /
  5. Khai phá văn bản với Bag-of-Words trong R

Connected

exercise

Làm việc với các đánh giá về Google

Giờ bạn đã làm sạch các đánh giá về Amazon, hãy thực hiện điều tương tự với các đánh giá về Google. qdap_clean() và tm_clean() đã có sẵn trong không gian làm việc để giúp bạn làm sạch goog_pros và goog_cons.

Instrucțiuni 1 / 2

undefined XP
  • 1
    • Áp dụng qdap_clean() cho goog_pros, gán vào qdap_cleaned_goog_pros.
    • Tạo một vector source (VectorSource()) từ qdap_cleaned_goog_pros, rồi chuyển nó thành một volatile corpus (VCorpus()), gán vào goog_p_corp.
    • Tạo goog_pros_corp bằng cách áp dụng tm_clean() cho goog_p_corp.
  • 2
    • Áp dụng qdap_clean() cho goog_cons, gán vào qdap_cleaned_goog_cons.
    • Tạo một vector source từ qdap_cleaned_goog_cons, rồi chuyển nó thành một volatile corpus, gán vào goog_c_corp.
    • Tạo goog_cons_corp bằng cách áp dụng tm_clean() cho goog_c_corp.