MulaiMulai sekarang secara gratis

Bandingkan Tidy Sentiment dengan Qdap Polarity

Di sini Anda akan mempelajari bahwa perbedaan metode sentimen akan menghasilkan keluaran yang berbeda. Sering kali Anda hanya perlu agar hasilnya searah meskipun rinciannya berbeda. Pada latihan sebelumnya Anda membuat tidy_reviews, yaitu data frame ulasan sewa tanpa stopword. Sebelumnya di bab ini, Anda menghitung dan memplot fungsi dasar polarity() dari qdap. Ini menunjukkan bahwa ulasan cenderung positif.

Sekarang mari lakukan analisis serupa dengan cara tidytext! Ingat dari bab sebelumnya, Anda akan melakukan inner_join() diikuti count() lalu pivot_wider().

Terakhir, Anda akan membuat kolom baru menggunakan mutate() dan memasukkan positive - negative.

Latihan ini adalah bagian dari kursus

Analisis Sentimen di R

Lihat Kursus

Petunjuk latihan

  • Menggunakan fungsi get_sentiments() dengan "bing" akan mengambil leksikon subjektivitas bing. Beri nama leksikon tersebut bing.
  • Karena Anda sudah menulis kode ini di Bab 2, cukup masukkan objek leksikon, bing, nama kolom baru (polarity) dan perhitungannya di dalam mutate().
  • Terakhir, panggil summary() pada objek baru pos_neg. Meskipun nilainya berbeda, setelah meninjau mean, apakah sebagian besar ulasan sewa sama-sama positif dibandingkan saat menggunakan polarity()? Apakah Anda melihat adanya "grade inflation"?

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Get the correct lexicon
bing <- ___

# Calculate polarity for each review
pos_neg <- tidy_reviews %>% 
  inner_join(___) %>%
  count(sentiment) %>%
  pivot_wider(names_from = sentiment, values_from = n, values_fill = 0) %>% 
  mutate(___ = ___ - ___)

# Check outcome
___
Edit dan Jalankan Kode