1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Dolování textu metodou Bag-of-Words v R

Connected

Cvičení

Souboj titánů, část 2! Negativní recenze

V obou společnostech zaměstnanci zmiňovali „kulturu" a „chytré lidi" – v pozitivních aspektech pracovního prostředí tedy existují určité shody. Pyramid plot ti ale umožňuje lépe porovnat, jak výrazně se tyto pozitivní rysy liší.

Teď se zaměříš na negativní recenze a vytvoříš stejnou vizualizaci. Tentokrát máš v pracovním prostoru již připravený datový rámec common_words. Společné bigramy v tomto cvičení pocházejí z negativních recenzí zaměstnanců.

Pokyny

100 XP
  • Pomocí slice_max() aplikovaného na common_words získej 5 nejčastějších bigramů podle sloupce diff. Výsledky nového objektu se vypíšou do konzole.
  • Vytvoř pyramid.plot(). Předej mu top5_df$AmazonNeg, top5_df$GoogleNeg a labels = top5_df$terms. Pro lepší popisky nastav:
    • gap na 12.
    • top.labels na c("Amzn", "Neg Words", "Goog")

Argumenty main a unit jsou již nastaveny za tebe.