Menerapkan LDA
Saatnya menjalankan topic model pertama Anda! Seperti telah dibahas, tiga argumen tambahan pada fungsi LDA() sangat penting untuk menjalankan topic model dengan benar. Perlu diingat bahwa menjalankan fungsi LDA() bisa memakan waktu sekitar 10 detik. Paket tidyverse dan tidytext beserta himpunan data tidy_twitter telah dimuat untuk Anda.
Latihan ini merupakan bagian dari kursus
Pengantar Analisis Teks di R
Instruksi latihan
- Muat paket
topicmodels. - Ubah hitungan kata per tweet menjadi DTM.
- Jalankan LDA dengan 2 topik dan Gibbs sampler.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Load the topicmodels package
___
# Cast the word counts by tweet into a DTM
dtm_twitter <- ___ %>%
___(___) %>%
___(___)
# Run an LDA with 2 topics and a Gibbs sampler
lda_out <- LDA(
___,
k = ___,
method = ___,
control = list(seed = 42)
)