MulaiMulai sekarang secara gratis

Bing tidy polarity: Hitung & pivot the white whale

Dalam latihan ini Anda akan menerapkan inner_join() lainnya menggunakan leksikon "bing".

Kemudian Anda akan memanipulasi hasilnya dengan count() dari dplyr dan pivot_wider() dari tidyr untuk mempelajari lebih lanjut tentang teks.

Fungsi pivot_wider() menyebarkan data ke beberapa kolom. Dalam kasus ini, nilai sentiment dan n yang sesuai merepresentasikan frekuensi istilah positif atau negatif untuk setiap baris. Menggunakan pivot_wider() mengubah data sehingga setiap baris kini memiliki nilai positif dan negatif, meskipun nilainya 0.

Latihan ini adalah bagian dari kursus

Analisis Sentimen di R

Lihat Kursus

Petunjuk latihan

Dalam latihan ini, sesi R Anda memiliki m_dick_tidy yang berisi buku Moby Dick dan bing, yang berisi leksikon seperti pada latihan sebelumnya.

  • Lakukan inner_join() pada m_dick_tidy dan bing.
    • Seperti sebelumnya, gabungkan kolom "term" di m_dick_tidy dengan kolom "word" di leksikon.
    • Beri nama objek baru tersebut moby_lex_words.
  • Buat kolom index, yang nilainya sama dengan as.numeric() yang diterapkan pada document. Ini dilakukan di dalam mutate() dalam tidyverse.
  • Buat moby_count dengan meneruskan moby_lex_words ke count(), dengan argumen sentiment, index.
  • Hasilkan moby_wide dengan mem-pipe moby_count ke pivot_wider() di mana names_from sama dengan kolom sentiment, values_from sama dengan kolom n dan nilai dilengkapi dengan values_fill = 0.
  • arrange adalah pipe berikutnya yang digunakan untuk mengurutkan baris berdasarkan nilai index

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Inner join
moby_lex_words <- inner_join(___, ___, by = c("___" = "___"))

moby_lex_words <- moby_lex_words %>%
  # Set index to numeric document
  mutate(___ = as.numeric(___))

moby_count <- moby_lex_words %>%
  # Count by sentiment, index
  ___(___, ___)

# Examine the counts
moby_count

moby_wide <- moby_count %>%
  # Pivot the sentiments
  pivot_wider(names_from = ___, values_from = ___, values_fill = ___) %>% 
  arrange(index)

# Review the pivoted data
moby_wide
Edit dan Jalankan Kode