Konuları görselleştirme
Önceki bölümlerde öğrendiklerimizi kullanarak LDA'nın ürettiği konuları görselleştirelim.
Bu egzersiz
R ile Metin Analizine Giriş
kursunun bir parçasıdırEgzersiz talimatları
- Konuya göre en yüksek olasılığa sahip ilk 10 kelimeyi tut.
- Kelime olasılığına göre
termdeğişkenini sıralayan bir faktör olanterm2yi oluştur. term2yi ve kelime olasılıklarını görselleştir.- Çubuk grafiği konuya göre (yani
~) bölümlere ayır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
word_probs <- lda_topics %>%
# Keep the top 10 highest word probabilities by topic
___(___) %>%
___(___) %>%
___() %>%
# Create term2, a factor ordered by word probability
___(term2 = ___(___))
# Plot term2 and the word probabilities
___(___) +
geom_col() +
# Facet the bar plot by topic
___(___, scales = "free") +
coord_flip()