1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Sentiment Analysis in R

Connected

cvičení

Hodnocení autorského úsilí

Autoři recenzí bývají sdílnější, když jsou zapálenější pro věc. Například nespokojený cestující napíše delší recenzi, čím horší (vnímaná) služba. Naopak méně emotivní cestující nemusí mít chuť trávit psaním mnoho času. Dlouhé recenze mohou celkový sentiment nadhodnocovat, protože s délkou textu přirozeně přibývá kladných nebo záporných slov. Toto cvičení pomáhá prozkoumat vztah mezi úsilím a sentimentem.

V tomto cvičení vizualizuješ vztah mezi vynaloženým úsilím a sentimentem. Připomeň si, že tibble s recenzemi obsahuje sloupec id a každý řádek odpovídá jednomu slovu. Prostý count() nad sloupcem id tedy zachytí počet slov v každé recenzi. Tento souhrn pak spojíš s daty o kladné a záporné polaritě. Výsledkem bude bodový graf znázorňující délku recenze a její vztah k polaritě.

Pokyny 1/2

undefined XP
    1
    2
  • Vypočítej míru úsilí jako počet výskytů id.
  • Proveď inner join s polaritou každé recenze, pos_neg.
  • Pomocí mutate přidej sloupec pol. Použij ifelse() a nastav pol na "Positive", pokud je polarity větší nebo rovno nule, jinak na "Negative".