Bing tidy polarity: Hitung & pivot the white whale
Dalam latihan ini Anda akan menerapkan inner_join() lainnya menggunakan leksikon "bing".
Kemudian Anda akan memanipulasi hasilnya dengan count() dari dplyr dan pivot_wider() dari tidyr untuk mempelajari lebih lanjut tentang teks.
Fungsi pivot_wider() menyebarkan data ke beberapa kolom. Dalam kasus ini, nilai sentiment dan n yang sesuai merepresentasikan frekuensi istilah positif atau negatif untuk setiap baris. Menggunakan pivot_wider() mengubah data sehingga setiap baris kini memiliki nilai positif dan negatif, meskipun nilainya 0.
Latihan ini adalah bagian dari kursus
Analisis Sentimen di R
Petunjuk latihan
Dalam latihan ini, sesi R Anda memiliki m_dick_tidy yang berisi buku Moby Dick dan bing, yang berisi leksikon seperti pada latihan sebelumnya.
- Lakukan
inner_join()padam_dick_tidydanbing.- Seperti sebelumnya, gabungkan kolom
"term"dim_dick_tidydengan kolom"word"di leksikon. - Beri nama objek baru tersebut
moby_lex_words.
- Seperti sebelumnya, gabungkan kolom
- Buat kolom
index, yang nilainya sama denganas.numeric()yang diterapkan padadocument. Ini dilakukan di dalammutate()dalam tidyverse. - Buat
moby_countdengan meneruskanmoby_lex_wordskecount(), dengan argumensentiment, index. - Hasilkan
moby_widedengan mem-pipemoby_countkepivot_wider()di mananames_fromsama dengan kolomsentiment,values_fromsama dengan kolomndan nilai dilengkapi denganvalues_fill = 0. arrangeadalah pipe berikutnya yang digunakan untuk mengurutkan baris berdasarkan nilaiindex
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Inner join
moby_lex_words <- inner_join(___, ___, by = c("___" = "___"))
moby_lex_words <- moby_lex_words %>%
# Set index to numeric document
mutate(___ = as.numeric(___))
moby_count <- moby_lex_words %>%
# Count by sentiment, index
___(___, ___)
# Examine the counts
moby_count
moby_wide <- moby_count %>%
# Pivot the sentiments
pivot_wider(names_from = ___, values_from = ___, values_fill = ___) %>%
arrange(index)
# Review the pivoted data
moby_wide