1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Dolování textu metodou Bag-of-Words v R

Connected

Cvičení

Práce s recenzemi Googlu

Teď, když jsou recenze Amazonu vyčištěné, je potřeba udělat totéž s recenzemi Googlu. K vyčištění goog_pros a goog_cons ti pomohou funkce qdap_clean() a tm_clean(), které máš v pracovním prostoru k dispozici.

Pokyny 1/2

undefined XP
  • 1
    • Aplikuj qdap_clean() na goog_pros a výsledek ulož do qdap_cleaned_goog_pros.
    • Z qdap_cleaned_goog_pros vytvoř vektorový zdroj (VectorSource()) a převeď ho na volatilní korpus (VCorpus()), výsledek ulož do goog_p_corp.
    • Vytvoř goog_pros_corp tak, že aplikuješ tm_clean() na goog_p_corp.
  • 2
    • Aplikuj qdap_clean() na goog_cons a výsledek ulož do qdap_cleaned_goog_cons.
    • Z qdap_cleaned_goog_cons vytvoř vektorový zdroj a převeď ho na volatilní korpus, výsledek ulož do goog_c_corp.
    • Vytvoř goog_cons_corp tak, že aplikuješ tm_clean() na goog_c_corp.