NRC’nin harika büyücüsü
Sona geldik ve artık birden fazla duygusal durumu etiketleyen NRC sözlüğüyle çalışacaksın. Plutchik’in duygu çarkını hatırlıyor musun? NRC sözlüğü, sözcükleri Plutchik’in 8 duygusuna artı pozitif/negatif olarak etiketler.
Bu egzersizde yeni bir işlemci var: %in%. Bu, bir vektördeki öğeleri başka bir vektörle eşleştirir. Aşağıdaki kodda %in% çıktısı FALSE, FALSE, TRUE olacaktır. Çünkü some_vec içinde 1 ve 2, some_other_vector içinde bulunmaz ama 3 bulunur ve TRUE döner. %in% eşleşmeleri bulmak için kullanışlıdır.
some_vec <- c(1, 2, 3)
some_other_vector <- c(3, "a", "b")
some_vec %in% some_other_vector
Bir diğer yeni işlemci !. Mantıksal koşullarda başına ! eklemek sonucu tersine çevirir. Yukarıdaki örnekte FALSE, FALSE, TRUE sırasıyla TRUE, TRUE, FALSE olur. %in% ile birlikte kullanmak yanıtı tersine çevirir ve eşleşen öğeleri çıkarmak için iyidir.
!some_vec %in% some_other_vector
Biz senin için oz veri setini, yani Oz Büyücüsü’nün tidy sürümünü, ve sütun adları yeniden adlandırılmış "NRC" sözlüğünü içeren nrc tibble’ını oluşturduk.
Bu egzersiz
R ile Duygu Analizi
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
oz_plutchik <- oz %>%
# Join to nrc lexicon by term = word
inner_join(___, by = ___("___" = "___")) %>%
# Only consider Plutchik sentiments
___(!___ %in% c("___", "___")) %>%
# Group by sentiment
___(___) %>%
# Get total count by sentiment
___(total_count = ___(___))