Faktörler kullanarak kelime sayılarını görselleştirme
Birçok özel durdurma sözcüğü (havayolu adları dahil) ekledim ve veriyi senin için düzenledim. Şimdi daha iyi bir görselleştirme oluşturacak ve kelimeleri kelime sayısına göre azalan düzende çizeceksin.
Bu egzersiz, kursun bir parçasıdır
R ile Metin Analizine Giriş
Egzersiz talimatları
non_complaintsiçinde 100'den fazla geçen terimleri tut.wordsütununu, kelime sayılarına göre sıralanan bir faktör olarak yeniden sırala.- Yeni kelime sütununu kullanarak türü faktör olan bir çubuk grafik oluştur.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
word_counts <- tidy_twitter %>%
filter(complaint_label == "Non-Complaint") %>%
count(word) %>%
# Keep terms that occur more than 100 times
___(___) %>%
# Reorder word as an ordered factor by word counts
___(word2 = ___(___, ___))
# Plot the new word column with type factor
___(___, aes(___, ___)) +
___() +
___() +
ggtitle("Non-Complaint Word Counts")