Sentimen dan emosi
Dalam himpunan data sentiments, leksikon nrc berisi kamus kata-kata beserta emosi yang terkait dengan kata tersebut. Emosi seperti joy, trust, anticipation, dan lainnya terdapat dalam himpunan data ini.
Pada himpunan data tweet bot Rusia yang telah Anda jelajahi, Anda telah melihat tweet yang dikirim oleh bot tweet berhaluan kiri dan kanan. Jelajahi isi tweet yang dikirim oleh bot berhaluan kiri (demokrat) menggunakan leksikon nrc. Tweet kiri, left, telah ditokenisasi menjadi kata-kata, dengan stop word dihapus.
Latihan ini adalah bagian dari kursus
Pengantar Natural Language Processing di R
Petunjuk latihan
- Buat sebuah tibble yang hanya berisi kata-kata anticipation dari leksikon
nrc. - Buat sebuah tibble yang hanya berisi kata-kata joy dari leksikon
nrc. - Cetak kata-kata
anticipationteratas yang ditemukan dalamleft_tokens. - Cetak kata-kata
joyteratas yang ditemukan dalamleft_tokens.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
left_tokens <- left %>%
unnest_tokens(output = "word", token = "words", input = content) %>%
anti_join(stop_words)
# Dictionaries
anticipation <- ___("nrc") %>%
___(sentiment == "anticipation")
joy <- ___("nrc") %>%
___(sentiment == "joy")
# Print top words for Anticipation and Joy
left_tokens %>%
___(anticipation, by = "word") %>%
___(word, sort = TRUE)
left_tokens %>%
___(joy, by = "word") %>%
___(word, sort = TRUE)