1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Sentiment Analysis in R

Connected

cvičení

Bing – polarita v tidyverse: Říkej mi Išmaeli (s ggplot2)!

Poslední cvičení s lexikonem Bing! V tomto cvičení použiješ operátor roury (%>%) k vytvoření časové osy sentimentu románu Moby Dick. Na závěr vytvoříš jednoduchý graf podle níže uvedené struktury kódu. Příští kapitola se vizualizacím věnuje podrobněji.

ggplot(pivoted_data, aes(index_column, polarity_column)) +
  geom_smooth(se = FALSE)

Pokyny 1/2

undefined XP
    1
    2
  • Proveď inner join tabulky moby s lexikonem bing.
    • K propojení tibbles zavolej inner_join().
    • Spoj podle sloupce term v textu a sloupce word v lexikonu.
  • Spočítej výskyty podle sentiment a index.
  • Přetvoř data tak, aby měl každý sentiment vlastní sloupec.
    • Zavolej pivot_wider().
    • Sloupec names_from (který se rozdělí do více sloupců) je sentiment.
    • Sloupec values_from (obsahující počty) je n.
    • Také zadej values_fill = 0, aby se chybějící hodnoty doplnily nulou.
  • Pomocí mutate() přidej sloupec polarity. Definuj ho jako rozdíl sloupců positive a negative.
  • arrange slouží k seřazení řádků před jejich zobrazením v posledním %>%