1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Sentiment Analysis in R

Connected

cvičení

Graf hustoty jádra

Teď, když víš, co je graf hustoty jádra, si ho můžeš vytvořit! Připomeň si, že jde o vyhlazený histogram, který není ovlivněn šířkou sloupce. V tomto cvičení si z hodnot sentimentu sestavíš vlastní graf hustoty jádra.

Budeš zobrazovat 2 křivky hustoty – jednu pro Agamemnona a druhou pro Čaroděje ze země Oz. U obou provedeš inner_join() s lexikonem "afinn". Vzpomeň si, že lexikon "afinn" hodnotí výrazy na škále od -5 do 5. Po převedení do tidy formátu si každá kniha zachová slova a příslušné skóre z lexikonu.

Pak musíš výsledky sloučit do jednoho datového rámce pomocí bind_rows() a vytvořit graf s ggplot2.

Z grafu snadno poznáš, která kniha používá více pozitivního a která více negativního jazyka. Překryv je pochopitelný – Dorotce se přece jen ledacos nepěkného přihodí – ale graf hustoty naznačuje, že v Čaroději ze země Oz je pravděpodobnost pozitivního jazyka vyšší než v Agamemnonovi.

Proměnné ag a oz jsou již načtené jako tidy verze Agamemnona a Čaroděje ze země Oz, a afinn je připravená jako podmnožina lexikonu "afinn" z balíčku tidytext.

Pokyny 1/2

undefined XP
    1
    2
  • Spoj ag s lexikonem afinn pomocí inner join a výsledek ulož do ag_afinn.
  • Totéž udělej pro Čaroděje ze země Oz – kód je stejný, jen začni s datasetem oz a výsledek ulož do oz_afinn.
  • Pomocí bind_rows() slouč ag_afinn a oz_afinn. Nastav argument .id na "book", aby vznikl nový sloupec s názvem každé knihy.