Ürüne göre sayma ve yeniden sıralama
tidy_twitter tokenize edildi ve özel durak kelimeler dahil durak kelimeler çıkarıldı. Şikayet ve şikayet olmayanlara göre kelime sayılarındaki farkları görselleştirmek istiyorsun.
Bu egzersiz
R ile Metin Analizine Giriş
kursunun bir parçasıdırEgzersiz talimatları
- Bir ifadenin şikayet olup olmamasına göre kelimeleri say.
- Şikayet olup olmamasına göre en üst 20 kelimeyi tut.
- Sayıya göre kelimeyi bir faktör olarak yeniden sıralamadan önce grubu kaldır (ungroup et).
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
word_counts <- tidy_twitter %>%
# Count words by whether or not its a complaint
___(___, ___) %>%
# Group by whether or not its a complaint
group_by(___) %>%
# Keep the top 20 words
___(___, ___) %>%
# Ungroup before reordering word as a factor by the count
___() %>%
___(word2 = ___(___, ___))