1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza sentymentu w R

Connected

ćwiczenie

Wykres gęstości jądra

Wiesz już, czym jest wykres gęstości jądra – czas go utworzyć! Przypomnij sobie, że to wygładzony histogram, który nie zależy od szerokości przedziałów. To ćwiczenie pomoże ci skonstruować taki wykres na podstawie wartości sentymentu.

Narysujesz 2 wykresy gęstości jądra – jeden dla Agamemnona i jeden dla Czarnoksiężnika z Oz. Dla obu wykonasz inner_join() z leksykonem "afinn". Przypomnij sobie, że leksykon "afinn" zawiera terminy z punktacją od -5 do 5. Po przekształceniu do formatu tidy oba teksty zachowają słowa i odpowiadające im punktacje z leksykonu.

Następnie połącz wyniki wierszami w jeden większy ramka danych za pomocą bind_rows() i utwórz wykres przy użyciu ggplot2.

Dzięki wizualizacji będziesz mógł ocenić, który tekst używa bardziej pozytywnego, a który bardziej negatywnego języka. Widoczne jest pewne nakładanie się – Dorocie przytrafiają się złe rzeczy – jednak wykres gęstości sugeruje większe prawdopodobieństwo pozytywnego języka w Czarnoksiężniku z Oz niż w Agamemnonie.

Załadowaliśmy ag i oz jako wersje tidy odpowiednio Agamemnona i Czarnoksiężnika z Oz oraz utworzyliśmy afinn jako podzbiór leksykonu "afinn" z biblioteki tidytext.

Instrukcje 1/2

undefined XP
    1
    2
  • Wykonaj inner join ag z leksykonem afinn i przypisz wynik do ag_afinn.
  • Zrób to samo dla Czarnoksiężnika z Oz. Kod jest taki sam, ale zacznij od zbioru danych oz i przypisz wynik do oz_afinn.
  • Użyj bind_rows(), aby połączyć ag_afinn z oz_afinn. Ustaw argument .id na "book", aby utworzyć nową kolumnę z nazwą każdej książki.