1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Sentiment Analysis in R

Connected

cvičení

Smutný konec? Chronologická polarita

Někdy chceš sledovat sentiment v průběhu času. Například během reklamní kampaně můžeš sledovat sentiment značky a vidět, jaký vliv kampaň má. Několik příkladů tohoto přístupu jsi viděl/a na konci předchozí kapitoly.

V tomto cvičení si zopakuješ postup pro zkoumání sentimentu v čase na románu Moby Dick. Dá se očekávat, že šťastné momenty v knize budou obsahovat více pozitivních slov než negativních. Naopak temné chvíle a smutné závěry by měly využívat negativnějšího jazyka. Zároveň se naučíš pár triků, jak udělat časovou řadu sentimentu vizuálně přitažlivější.

Postup je následující:

  1. Propoj text s lexikonem pomocí inner join na základě slova.
  2. Spočítej sentimenty podle řádku.
  3. Přetvoř data tak, aby každý sentiment měl vlastní sloupec.
  4. (V závislosti na lexikonu) Vypočítej polaritu jako kladné skóre minus záporné skóre.
  5. Vykresli časovou řadu polarity.

Toto cvičení ti bude povědomé – navazuje na Bing tidy polarity: Call me Ishmael (with ggplot2)!.

Pokyny 1/2

undefined XP
    1
    2
  • Pomocí inner_join() propoj předpřipravenou tidy verzi Moby Dicka, moby, s lexikonem bing.
    • Propoj je podle sloupce "term" v textu a sloupce "word" v lexikonu.
  • Spočítej výskyty podle sentiment a index.
  • Přetvoř data tak, aby každý sentiment měl vlastní sloupec – použij pivot_wider() s následujícími argumenty:
    • names_from = sentiment – odkazuje na sloupec sentiment
    • values_from = n – přebírá hodnoty ze sloupce n
    • values_fill = 0 – doplní NA hodnotou 0
  • Pomocí mutate() přidej dva sloupce: polarity a line_number.
    • Nastav polarity jako rozdíl kladného a záporného skóre.
    • Nastav line_number jako číslo řádku pomocí funkce row_number().