1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza sentymentu w R

Connected

ćwiczenie

Szybkie sprawdzenie podstawowej polaryzacji

Na początku projektu analizy sentymentu szybkie wywołanie polarity() może pomóc określić oczekiwania i lepiej zrozumieć problem. W tym ćwiczeniu (żeby zaoszczędzić czas) zastosujesz polarity() do fragmentu wektora comments, podczas gdy większy obiekt polaryzacji będzie wczytywany w tle.

Korzystając z wykresu gęstości jądra, zauważysz, że recenzje nie skupiają się wokół 0. Zwykle wynika to z dwóch przyczyn. Po pierwsze, normy społeczne mogą skłaniać recenzentów do wyrażania się w sposób uprzejmy, a nie neutralny – to zjawisko zależy od kanału komunikacji. Na kanałach o bardziej złośliwym tonie, takich jak e-sport czy media społecznościowe, wyniki mogą być za to zaniżone. Po drugie, przyczyną może być tzw. „sentyment oparty na cechach". Autor recenzji może napisać na przykład: „łóżko było wygodne i przyjemne, ale kuchnia była brudna i obrzydliwa". Taka recenzja obejmuje kilka cech jednocześnie, co może zaburzać średnią ocenę.

W kolejnym ćwiczeniu dokonasz korekty tego „zawyżenia ocen", ale na razie przeanalizuj recenzje bez żadnych zmian.

Instrukcje

100 XP
  • Utwórz obiekt practice_pol, używając polarity() na pierwszych sześciu recenzjach: bos_reviews$comments[1:6].
  • Przejrzyj zwrócony obiekt polaryzacji, wywołując practice_pol.
  • Wywołaj summary() na practice_pol$all$polarity – w ten sposób uzyskasz ogólną polaryzację dla wszystkich 6 komentarzy.
  • Wczytaliśmy też większy obiekt polaryzacji dla wszystkich 1000 komentarzy. Nowy obiekt nosi nazwę bos_pol. Zastosuj teraz summary() na odpowiednim elemencie listy, który zwraca wszystkie wyniki polaryzacji z bos_pol.
  • Przykładowy kod zawiera wykres słupkowy i wykres gęstości jądra, które są prawie gotowe do wyświetlenia. Musisz podać ramkę danych reprezentującą wszystkie wyniki. Podpowiedź: w poprzednim kroku polarity to kolumna tej ramki danych.