MulaiMulai sekarang secara gratis

Bagi & taklukkan: Menggunakan polaritas untuk comparison cloud

Sekarang setelah Anda melihat bagaimana polaritas dapat digunakan untuk membagi korpus, mari kita praktikkan! Kode ini akan memandu Anda membagi korpus berdasarkan sentimen sehingga Anda dapat menelaah informasi dalam subset, bukan secara keseluruhan.

Sesi R Anda memiliki oz_pol yang dibuat dengan menerapkan polarity() pada "The Wonderful Wizard of Oz."

Untuk memudahkan, kami membuat fungsi kustom sederhana bernama pol_subsections() yang akan membagi korpus berdasarkan skor polaritas. Pertama, fungsi ini menerima sebuah data frame dengan setiap baris mewakili satu kalimat atau dokumen dalam korpus. Data frame kemudian diambil subset-nya di mana nilai polaritas lebih besar atau lebih kecil dari 0. Terakhir, kalimat positif dan negatif (polaritas non-nol) digabung menggunakan parameter collapse sehingga term dikelompokkan menjadi satu korpus. Terakhir, kedua dokumen tersebut dikonkatenasi menjadi satu vektor berisi dua dokumen yang berbeda.

pol_subsections <- function(df) {
  x.pos <- subset(df$text, df$polarity > 0)
  x.neg <- subset(df$text, df$polarity < 0)
  x.pos <- paste(x.pos, collapse = " ")
  x.neg <- paste(x.neg, collapse = " ")
  all.terms <- c(x.pos, x.neg)
  return(all.terms)
}

Pada tahap ini Anda telah mengabaikan kalimat netral dan ingin berfokus pada pengaturan teks yang tersisa. Dalam latihan ini kita kembali menggunakan operator %>% untuk meneruskan objek ke fungsi. Setelah pembersihan sederhana, gunakan comparison.cloud() untuk membuat visualnya.

Latihan ini adalah bagian dari kursus

Analisis Sentimen di R

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

oz_df <- oz_pol$all %>%
  # Select text.var as text and polarity
  ___(text = ___, polarity = ___)

# Apply custom function pol_subsections()
all_terms <- ___(___)

all_corpus <- all_terms %>%
  # Source from a vector
  ___() %>% 
  # Make a volatile corpus 
  ___()
Edit dan Jalankan Kode