Tidy Duyguyu Qdap Polarity ile Karşılaştır
Burada, farklı duygu analizi yöntemlerinin farklı sonuçlar verebileceğini göreceksin. Çoğu zaman, ayrıntılar farklı olsa da sonuçların yön olarak hizalanması yeterlidir. Son egzersizde, durak sözcükleri çıkarılmış kiralama yorumlarından oluşan bir veri çerçevesi olan tidy_reviews oluşturmuştun. Bu bölümün başlarında, qdap'ın temel polarity() fonksiyonunu hesaplayıp görselleştirmiştin. Bu, yorumların genel olarak olumluya meyilli olduğunu göstermişti.
Şimdi benzer bir analizi tidytext yaklaşımıyla yapalım! Önceki bir bölümden hatırlayacağın gibi bir inner_join(), ardından count() ve sonra da pivot_wider() uygulayacaksın.
Son olarak, mutate() kullanarak yeni bir sütun oluşturacak ve positive - negative ifadesini kullanacaksın.
Bu egzersiz
R ile Duygu Analizi
kursunun bir parçasıdırEgzersiz talimatları
- "bing" ile
get_sentiments()fonksiyonunu kullanmak, bing öznelik sözlüğünü getirir. Sözlüğübingolarak adlandır. - Bu kodu Bölüm 2'de zaten yazdığın için, sadece sözlük nesnesini (
bing), yeni sütun adını (polarity) ve hesaplamasınımutate()içine girmen yeterli. - Son olarak yeni nesne
pos_negüzerindesummary()çağır. Değerler farklı olsa da, ortalamayı inceledikten sonra,polarity()kullanmaya kıyasla çoğu kiralama yorumu benzer şekilde olumlu mu? "Not şişirmesi" görüyor musun?
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Get the correct lexicon
bing <- ___
# Calculate polarity for each review
pos_neg <- tidy_reviews %>%
inner_join(___) %>%
count(sentiment) %>%
pivot_wider(names_from = sentiment, values_from = n, values_fill = 0) %>%
mutate(___ = ___ - ___)
# Check outcome
___