Membandingkan keluaran LDA
Kita baru menjalankan satu LDA dengan jumlah topik tertentu. Hasil yang sudah ditata rapi dari model tersebut, lda_out_tidy, telah dimuat bersama dtm_twitter di ruang kerja Anda. Sekarang jalankan LDA dengan 3 topik dan bandingkan keluarannya.
> lda_out_tidy
# A tibble: 35,928 x 3
topic term beta
<int> <chr> <dbl>
1 1 flight 0.0343
2 1 time 0.0102
3 2 service 0.00882
4 1 plane 0.00688
5 1 trip 0.00614
6 2 customer 0.00604
7 1 delayed 0.00596
8 2 airline 0.00593
9 1 hours 0.00532
10 1 day 0.00499
# ... with 35,918 more rows
Latihan ini adalah bagian dari kursus
Pengantar Analisis Teks di R
Petunjuk latihan
- Jalankan LDA dengan 3 topik dan Gibbs sampler (ini mungkin memerlukan waktu 10 detik atau lebih).
- Tata rapi matriks probabilitas kata.
- Urutkan topik berdasarkan probabilitas kata secara menurun.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Run an LDA with 3 topics and a Gibbs sampler
lda_out2 <- ___(
___,
___,
___,
control = list(seed = 42)
)
# Tidy the matrix of word probabilities
lda_topics2 <- ___ %>%
___(___)
# Arrange the topics by word probabilities in descending order
___ %>%
___(___)