Plot kerapatan kernel
Sekarang setelah Anda mempelajari plot kerapatan kernel, Anda dapat membuatnya! Ingat, ini mirip histogram yang dihaluskan tetapi tidak terpengaruh oleh lebar bin. Latihan ini akan membantu Anda menyusun plot kerapatan kernel dari nilai-nilai sentimen.
Dalam latihan ini Anda akan memplot 2 kerapatan kernel: satu untuk Agamemnon dan satu lagi untuk The Wizard of Oz. Untuk keduanya Anda akan melakukan inner_join() dengan leksikon "afinn". Ingat bahwa leksikon "afinn" memiliki istilah yang diberi skor dari -5 hingga 5. Setelah dalam format rapi (tidy), kedua buku akan mempertahankan kata-kata beserta skor yang sesuai dari leksikon.
Setelah itu, Anda perlu menggabungkan baris hasil ke dalam data frame yang lebih besar menggunakan bind_rows() dan membuat plot dengan ggplot2.
Dari visualisasi tersebut Anda akan dapat memahami buku mana yang menggunakan bahasa lebih positif dibandingkan negatif. Jelas ada tumpang tindih karena hal-hal negatif terjadi pada Dorothy, tetapi Anda dapat menyimpulkan bahwa kerapatan kernel menunjukkan probabilitas yang lebih besar untuk bahasa positif di The Wizard of Oz dibandingkan Agamemnon.
Kami telah memuat ag dan oz sebagai versi tidy dari Agamemnon dan The Wizard of Oz, serta membuat afinn sebagai subset dari leksikon "afinn" di tidytext.
Latihan ini adalah bagian dari kursus
Analisis Sentimen di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
ag_afinn <- ag %>%
# Inner join to afinn lexicon
___(___, by = c("term" = "word"))
oz_afinn <- oz %>%
# Inner join to afinn lexicon
___
# Combine
all_df <- ___(agamemnon = ___, oz = ___, .id = "___")