1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Dolování textu metodou Bag-of-Words v R

Connected

Bài tập

Rychlý přehled recenzí Googlu

Rozhodneš se vytvořit comparison.cloud() pro pozitivní a negativní recenze Googlu – jako srovnání s Amazonem. Díky tomu rychle zjistíš, jaké výrazy se nejčastěji vyskytují, aniž bys musel/a trávit tolik času jako u analýzy recenzí Amazonu v předchozích cvičeních.

Máš k dispozici korpus all_goog_corpus obsahující 500 pozitivních a 500 negativních recenzí Googlu. Korpus vyčistíš a vytvoříš srovnávací cloud porovnávající nejčastější slova z kladných i záporných recenzí.

Hướng dẫn

100 XP

Objekt all_goog_corpus s kladnými a zápornými recenzemi Googlu je načtený v tvém pracovním prostředí.

  • Vytvoř all_goog_corp tak, že vyčistíš all_goog_corpus pomocí předdefinované funkce tm_clean().
  • Vytvoř all_tdm převodem all_goog_corp na matici termů a dokumentů.
  • Vytvoř all_m převodem all_tdm na matici.
  • Sestav comparison.cloud() z all_m. Nastav max.words na 100. Argument colors je už zadaný za tebe.