MulaiMulai sekarang secara gratis

Penyihir hebat dari NRC

Terakhir namun tidak kalah penting, Anda akan bekerja dengan leksikon NRC yang memberi label kata-kata berdasarkan beberapa keadaan emosi. Ingat roda emosi Plutchik? Leksikon NRC menandai kata-kata sesuai 8 emosi Plutchik ditambah positif/negatif.

Pada latihan ini ada operator baru, %in%, yang mencocokkan sebuah vektor dengan vektor lain. Pada kode di bawah, %in% akan menghasilkan FALSE, FALSE, TRUE. Ini karena di dalam some_vec, 1 dan 2 tidak ditemukan di some_other_vector, tetapi 3 ditemukan sehingga menghasilkan TRUE. Operator %in% berguna untuk menemukan kecocokan.

some_vec <- c(1, 2, 3)
some_other_vector <- c(3, "a", "b")
some_vec %in% some_other_vector

Operator baru lainnya adalah !. Untuk kondisi logis, menambahkan ! akan membalik hasilnya. Pada contoh di atas, FALSE, FALSE, TRUE akan menjadi TRUE, TRUE, FALSE. Menggunakannya bersama %in% akan membalik respons dan bagus untuk menghapus item yang cocok.

!some_vec %in% some_other_vector

Kami telah menyiapkan oz, versi tidy dari The Wizard of Oz, serta nrc yang berisi leksikon "NRC" dengan nama kolom yang telah diganti.

Latihan ini adalah bagian dari kursus

Analisis Sentimen di R

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

oz_plutchik <- oz %>% 
  # Join to nrc lexicon by term = word
  inner_join(___, by = ___("___" = "___")) %>% 
  # Only consider Plutchik sentiments
  ___(!___ %in% c("___", "___")) %>%
  # Group by sentiment
  ___(___) %>% 
  # Get total count by sentiment
  ___(total_count = ___(___))
Edit dan Jalankan Kode