Penyihir hebat dari NRC
Terakhir namun tidak kalah penting, Anda akan bekerja dengan leksikon NRC yang memberi label kata-kata berdasarkan beberapa keadaan emosi. Ingat roda emosi Plutchik? Leksikon NRC menandai kata-kata sesuai 8 emosi Plutchik ditambah positif/negatif.
Pada latihan ini ada operator baru, %in%, yang mencocokkan sebuah vektor dengan vektor lain. Pada kode di bawah, %in% akan menghasilkan FALSE, FALSE, TRUE. Ini karena di dalam some_vec, 1 dan 2 tidak ditemukan di some_other_vector, tetapi 3 ditemukan sehingga menghasilkan TRUE. Operator %in% berguna untuk menemukan kecocokan.
some_vec <- c(1, 2, 3)
some_other_vector <- c(3, "a", "b")
some_vec %in% some_other_vector
Operator baru lainnya adalah !. Untuk kondisi logis, menambahkan ! akan membalik hasilnya. Pada contoh di atas, FALSE, FALSE, TRUE akan menjadi TRUE, TRUE, FALSE. Menggunakannya bersama %in% akan membalik respons dan bagus untuk menghapus item yang cocok.
!some_vec %in% some_other_vector
Kami telah menyiapkan oz, versi tidy dari The Wizard of Oz, serta nrc yang berisi leksikon "NRC" dengan nama kolom yang telah diganti.
Latihan ini adalah bagian dari kursus
Analisis Sentimen di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
oz_plutchik <- oz %>%
# Join to nrc lexicon by term = word
inner_join(___, by = ___("___" = "___")) %>%
# Only consider Plutchik sentiments
___(!___ %in% c("___", "___")) %>%
# Group by sentiment
___(___) %>%
# Get total count by sentiment
___(total_count = ___(___))