Polaritas rapi Bing: Contoh sederhana
Sekarang setelah Anda memahami dasar-dasar inner join, mari terapkan pada leksikon "Bing". Perlu diingat bahwa fungsi inner_join() berasal dari dplyr dan objek leksikon diperoleh menggunakan fungsi get_sentiments() dari tidytext.
Leksikon Bing memberi label kata sebagai positif atau negatif. Tiga latihan berikut memungkinkan Anda berinteraksi dengan leksikon ini secara spesifik. Untuk menggunakan get_sentiments(), berikan string seperti "afinn", "bing", "nrc", atau "loughran" untuk mengunduh leksikon yang diinginkan.
Alur kerja inner join:
- Dapatkan leksikon yang benar menggunakan
get_sentiments(). - Berikan leksikon dan data teks rapi ke
inner_join(). - Agar
inner_join()berfungsi, harus ada nama kolom yang sama. Jika tidak ada nama kolom yang sama, nyatakan dengan parameter tambahan,byyang nilainya sama dengancberisi nama kolom seperti di bawah ini.
object <- x %>%
inner_join(y, by = c("column_from_x" = "column_from_y"))
- Lakukan agregasi dan analisis pada irisan tabel tersebut.
Latihan ini adalah bagian dari kursus
Analisis Sentimen di R
Petunjuk latihan
Kami telah memuat ag_txt yang berisi 100 baris pertama dari Agamemnon dan ag_tidy yang merupakan versinya dalam format tidy.
- Untuk perbandingan, gunakan
polarity()padaag_txt. - Dapatkan leksikon
"bing"dengan memberikan string tersebut keget_sentiments(). - Lakukan
inner_join()denganag_tidydanbing.- Kolom kata bernama
"term"diag_tidydan"word"di leksikon, jadi nyatakan argumenby. - Beri nama objek baru
ag_bing_words.
- Kolom kata bernama
- Cetak
ag_bing_words, dan amati beberapa kata yang muncul dalam hasil. - Teruskan
ag_bing_wordskecount()atassentimentmenggunakan operator pipe, %>%. Bandingkan skorpolarity()dengan rasio hitungan sentimen.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Qdap polarity
___
# Get Bing lexicon
bing <- get_sentiments("___")
# Join text to lexicon
ag_bing_words <- ___(___, ___, by = c("___" = "___"))
# Examine
ag_bing_words
# Get counts by sentiment
ag_bing_words %>%
___(___)