Menerapkan LDA
Saatnya menjalankan topic model pertama Anda! Seperti telah dibahas, tiga argumen tambahan pada fungsi LDA() sangat penting untuk menjalankan topic model dengan benar. Perlu diingat bahwa menjalankan fungsi LDA() bisa memakan waktu sekitar 10 detik. Paket tidyverse dan tidytext beserta himpunan data tidy_twitter telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Pengantar Analisis Teks di R
Petunjuk latihan
- Muat paket
topicmodels. - Ubah hitungan kata per tweet menjadi DTM.
- Jalankan LDA dengan 2 topik dan Gibbs sampler.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load the topicmodels package
___
# Cast the word counts by tweet into a DTM
dtm_twitter <- ___ %>%
___(___) %>%
___(___)
# Run an LDA with 2 topics and a Gibbs sampler
lda_out <- LDA(
___,
k = ___,
method = ___,
control = list(seed = 42)
)