1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza sentymentu w R

Connected

ćwiczenie

Ocena zaangażowania autora

Autorzy często piszą więcej, gdy są bardziej zaangażowani emocjonalnie. Na przykład rozgniewany pasażer linii lotniczych zostawia dłuższą recenzję, im gorsza była (jego zdaniem) obsługa. Z kolei mniej poruszony pasażer może nie czuć potrzeby, by poświęcać dużo czasu na pisanie. Długie recenzje mogą zawyżać ogólny wynik sentymentu, ponieważ im dłuższa recenzja, tym więcej zawiera pozytywnego lub negatywnego języka. To ćwiczenie pomaga zbadać zależność między zaangażowaniem a sentymentem.

W tym ćwiczeniu zwizualizujesz tę zależność. Pamiętaj, że twoja tabela tibble z recenzjami wynajmu zawiera kolumnę id, a każdy wiersz reprezentuje jedno słowo. Dlatego proste wywołanie count() na kolumnie id pozwoli uchwycić liczbę słów użytych w każdej recenzji. Następnie połączysz to podsumowanie z danymi o polaryzacji. Na koniec stworzysz wykres punktowy, który pokaże związek między długością recenzji a jej polaryzacją.

Instrukcje 1/2

undefined XP
    1
    2
  • Oblicz miarę zaangażowania jako liczbę wystąpień id.
  • Wykonaj złączenie wewnętrzne z polaryzacją każdej recenzji, pos_neg.
  • Użyj mutate, aby dodać kolumnę pol. Zastosuj ifelse(), by ustawić pol na "Positive", jeśli polarity jest większe lub równe zero, w przeciwnym razie na "Negative".