Bandingkan Tidy Sentiment dengan Qdap Polarity
Di sini Anda akan mempelajari bahwa perbedaan metode sentimen akan menghasilkan keluaran yang berbeda. Sering kali Anda hanya perlu agar hasilnya searah meskipun rinciannya berbeda. Pada latihan sebelumnya Anda membuat tidy_reviews, yaitu data frame ulasan sewa tanpa stopword. Sebelumnya di bab ini, Anda menghitung dan memplot fungsi dasar polarity() dari qdap. Ini menunjukkan bahwa ulasan cenderung positif.
Sekarang mari lakukan analisis serupa dengan cara tidytext! Ingat dari bab sebelumnya, Anda akan melakukan inner_join() diikuti count() lalu pivot_wider().
Terakhir, Anda akan membuat kolom baru menggunakan mutate() dan memasukkan positive - negative.
Latihan ini adalah bagian dari kursus
Analisis Sentimen di R
Petunjuk latihan
- Menggunakan fungsi
get_sentiments()dengan "bing" akan mengambil leksikon subjektivitas bing. Beri nama leksikon tersebutbing. - Karena Anda sudah menulis kode ini di Bab 2, cukup masukkan objek leksikon,
bing, nama kolom baru (polarity) dan perhitungannya di dalammutate(). - Terakhir, panggil
summary()pada objek barupos_neg. Meskipun nilainya berbeda, setelah meninjau mean, apakah sebagian besar ulasan sewa sama-sama positif dibandingkan saat menggunakanpolarity()? Apakah Anda melihat adanya "grade inflation"?
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Get the correct lexicon
bing <- ___
# Calculate polarity for each review
pos_neg <- tidy_reviews %>%
inner_join(___) %>%
count(sentiment) %>%
pivot_wider(names_from = sentiment, values_from = n, values_fill = 0) %>%
mutate(___ = ___ - ___)
# Check outcome
___