Polarity pada teks sebenarnya
Sejauh ini Anda telah mempelajari komponen dasar yang diperlukan untuk menilai maksud positif atau negatif dalam teks. Ingat poin-poin berikut agar Anda yakin dengan hasil Anda.
- Subjectivity lexicon adalah daftar kata yang telah ditentukan sebelumnya dan terkait dengan emosi atau nuansa positif/negatif.
- Anda tidak perlu mencantumkan setiap kata dalam subjectivity lexicon karena Hukum Zipf menggambarkan pola ekspresi manusia.
Cara cepat untuk memulai adalah menggunakan fungsi polarity() yang memiliki subjectivity lexicon bawaan.
Fungsi ini memindai teks untuk mengidentifikasi kata-kata dalam leksikon. Lalu, fungsi membuat sebuah klaster di sekitar kata subjektivitas yang teridentifikasi. Di dalam klaster, valence shifters menyesuaikan skor. Valence shifters adalah kata-kata yang memperkuat atau meniadakan maksud emosional dari kata subjektivitas. Misalnya, "well known" bersifat positif, sedangkan "not well known" bersifat negatif. Di sini "not" adalah istilah negasi yang membalikkan maksud emosional dari "well known." Sebaliknya, "very well known" menggunakan penguat (amplifier) yang meningkatkan maksud positif.
Fungsi polarity() kemudian menghitung skor menggunakan istilah subjektivitas, valence shifters, dan total jumlah kata dalam potongan teks. Latihan ini menunjukkan perhitungan polarity yang sederhana. Pada video berikutnya kita akan melihat lebih dalam ke dalam polarity() untuk detail lebih lanjut.
Latihan ini adalah bagian dari kursus
Analisis Sentimen di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Example statement
positive <- "DataCamp courses are good for learning"
# Calculate polarity of statement
(pos_score <-___(___))