Yazarın harcadığı çabayı değerlendirme
Yazarlar, daha tutkulu olduklarında genelde daha fazla kelime kullanırlar. Örneğin, çok sinirli bir havayolu yolcusu, hizmeti ne kadar kötü (öyle algıladıkça) görüyorsa o kadar uzun bir yorum bırakır. Tersine, çok da hevesli olmayan bir yolcu, yorum yazmak için fazla zaman harcamaya kendini mecbur hissetmeyebilir. Uzun yorumlar, yorum uzadıkça doğası gereği daha fazla olumlu ya da olumsuz ifade içereceği için genel duyarlılığı şişirebilir. Bu kodlama egzersizi, çaba ve duyarlılığı incelemene yardımcı olur.
Bu egzersizde çaba ile duyarlılık arasındaki ilişkiyi görselleştireceksin. Kiralık ev yorumlarından oluşan tibble'ında bir id olduğunu ve her satırın bir kelimeyi temsil ettiğini hatırla. Bu nedenle id üzerinde basit bir count(), her yorumda kullanılan kelime sayısını yakalar. Sonrasında bu özeti pozitif ve negatif verilerle birleştireceksin. Sonuçta, yazarın yorum uzunluğunu ve bunun kutupsallıkla ilişkisini görselleştiren bir saçılım grafiği oluşturacaksın.
Bu egzersiz
R ile Duygu Analizi
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Review tidy_reviews and pos_neg
tidy_reviews
pos_neg
pos_neg_pol <- tidy_reviews %>%
# Effort is measured as count by id
___(___) %>%
# Inner join to pos_neg
___(___) %>%
# Add polarity status
___(pol = ___(___, "___", "___"))
# Examine results
pos_neg_pol