Akhir yang tidak bahagia? Polaritas kronologis
Terkadang Anda ingin melacak sentimen dari waktu ke waktu. Misalnya, selama kampanye iklan Anda dapat melacak sentimen terhadap merek untuk melihat dampak kampanye tersebut. Anda telah melihat beberapa contohnya di akhir bab sebelumnya.
Dalam latihan ini Anda akan mengulas alur kerja untuk mengeksplorasi sentimen dari waktu ke waktu menggunakan novel Moby Dick. Secara umum, momen-momen bahagia dalam buku seharusnya berisi lebih banyak kata positif daripada negatif. Sebaliknya, momen suram dan akhir yang sedih seharusnya menggunakan bahasa yang lebih negatif. Anda juga akan melihat beberapa trik untuk membuat deret waktu sentimen Anda lebih menarik secara visual.
Ingat bahwa alur kerjanya adalah:
- Lakukan inner join antara teks dan leksikon berdasarkan kata.
- Hitung jumlah sentimen per baris.
- Ubah bentuk data sehingga tiap sentimen memiliki kolomnya sendiri.
- (Bergantung pada leksikon) Hitung polaritas sebagai skor positif dikurangi skor negatif.
- Plot deret waktu polaritas.
Latihan ini seharusnya terlihat familier: ini memperluas Bing tidy polarity: Call me Ishmael (with ggplot2)!.
Latihan ini adalah bagian dari kursus
Analisis Sentimen di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
moby_polarity <- moby %>%
# Inner join to the lexicon
___(___, by = c("___" = "___")) %>%
# Count by sentiment, index
___(___, ___) %>%
# Pivot sentiments wider
___(names_from = ___, values_from = ___, values_fill = ___) %>%
mutate(
# Add polarity field
___ = ___ - ___,
# Add line number field
___ = ___()
)