Bandingkan Tidy Sentiment dengan Qdap Polarity

Di sini Anda akan mempelajari bahwa perbedaan metode sentimen akan menghasilkan keluaran yang berbeda. Sering kali Anda hanya perlu agar hasilnya searah meskipun rinciannya berbeda. Pada latihan sebelumnya Anda membuat tidy_reviews, yaitu data frame ulasan sewa tanpa stopword. Sebelumnya di bab ini, Anda menghitung dan memplot fungsi dasar polarity() dari qdap. Ini menunjukkan bahwa ulasan cenderung positif.

Sekarang mari lakukan analisis serupa dengan cara tidytext! Ingat dari bab sebelumnya, Anda akan melakukan inner_join() diikuti count() lalu pivot_wider().

Terakhir, Anda akan membuat kolom baru menggunakan mutate() dan memasukkan positive - negative.

Latihan ini merupakan bagian dari kursus

Analisis Sentimen di R

Lihat Kursus

Instruksi latihan

Menggunakan fungsi get_sentiments() dengan "bing" akan mengambil leksikon subjektivitas bing. Beri nama leksikon tersebut bing.
Karena Anda sudah menulis kode ini di Bab 2, cukup masukkan objek leksikon, bing, nama kolom baru (polarity) dan perhitungannya di dalam mutate().
Terakhir, panggil summary() pada objek baru pos_neg. Meskipun nilainya berbeda, setelah meninjau mean, apakah sebagian besar ulasan sewa sama-sama positif dibandingkan saat menggunakan polarity()? Apakah Anda melihat adanya "grade inflation"?

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Get the correct lexicon
bing <- ___

# Calculate polarity for each review
pos_neg <- tidy_reviews %>% 
  inner_join(___) %>%
  count(sentiment) %>%
  pivot_wider(names_from = sentiment, values_from = n, values_fill = 0) %>% 
  mutate(___ = ___ - ___)

# Check outcome
___

Edit dan Jalankan Kode