Plot kerapatan kernel

Sekarang setelah Anda mempelajari plot kerapatan kernel, Anda dapat membuatnya! Ingat, ini mirip histogram yang dihaluskan tetapi tidak terpengaruh oleh lebar bin. Latihan ini akan membantu Anda menyusun plot kerapatan kernel dari nilai-nilai sentimen.

Dalam latihan ini Anda akan memplot 2 kerapatan kernel: satu untuk Agamemnon dan satu lagi untuk The Wizard of Oz. Untuk keduanya Anda akan melakukan inner_join() dengan leksikon "afinn". Ingat bahwa leksikon "afinn" memiliki istilah yang diberi skor dari -5 hingga 5. Setelah dalam format rapi (tidy), kedua buku akan mempertahankan kata-kata beserta skor yang sesuai dari leksikon.

Setelah itu, Anda perlu menggabungkan baris hasil ke dalam data frame yang lebih besar menggunakan bind_rows() dan membuat plot dengan ggplot2.

Dari visualisasi tersebut Anda akan dapat memahami buku mana yang menggunakan bahasa lebih positif dibandingkan negatif. Jelas ada tumpang tindih karena hal-hal negatif terjadi pada Dorothy, tetapi Anda dapat menyimpulkan bahwa kerapatan kernel menunjukkan probabilitas yang lebih besar untuk bahasa positif di The Wizard of Oz dibandingkan Agamemnon.

Kami telah memuat ag dan oz sebagai versi tidy dari Agamemnon dan The Wizard of Oz, serta membuat afinn sebagai subset dari leksikon "afinn" di tidytext.

Latihan ini merupakan bagian dari kursus

Analisis Sentimen di R

Lihat Kursus

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

ag_afinn <- ag %>% 
  # Inner join to afinn lexicon
  ___(___, by = c("term" = "word"))

oz_afinn <- oz %>% 
  # Inner join to afinn lexicon
  ___ 

# Combine
all_df <- ___(agamemnon = ___, oz = ___, .id = "___")

Edit dan Jalankan Kode