LDA çıktısını karşılaştırma
Şimdiye kadar yalnızca belirli sayıda konuyla tek bir LDA çalıştırdık. O modelden elde edilen düzenlenmiş çıktı lda_out_tidy, dtm_twitter ile birlikte çalışma alanına yüklendi. Şimdi 3 konuyla bir LDA çalıştır ve çıktıları karşılaştır.
> lda_out_tidy
# A tibble: 35,928 x 3
topic term beta
<int> <chr> <dbl>
1 1 flight 0.0343
2 1 time 0.0102
3 2 service 0.00882
4 1 plane 0.00688
5 1 trip 0.00614
6 2 customer 0.00604
7 1 delayed 0.00596
8 2 airline 0.00593
9 1 hours 0.00532
10 1 day 0.00499
# ... with 35,918 more rows
Bu egzersiz
R ile Metin Analizine Giriş
kursunun bir parçasıdırEgzersiz talimatları
- 3 konuyla ve Gibbs örnekleyiciyle bir LDA çalıştır (bu 10 saniye veya daha uzun sürebilir).
- Sözcük olasılıkları matrisini tidy formata getir.
- Konuları sözcük olasılıklarına göre azalan sırada sırala.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Run an LDA with 3 topics and a Gibbs sampler
lda_out2 <- ___(
___,
___,
___,
control = list(seed = 42)
)
# Tidy the matrix of word probabilities
lda_topics2 <- ___ %>%
___(___)
# Arrange the topics by word probabilities in descending order
___ %>%
___(___)