MulaiMulai sekarang secara gratis

Menerapkan LDA

Saatnya menjalankan topic model pertama Anda! Seperti telah dibahas, tiga argumen tambahan pada fungsi LDA() sangat penting untuk menjalankan topic model dengan benar. Perlu diingat bahwa menjalankan fungsi LDA() bisa memakan waktu sekitar 10 detik. Paket tidyverse dan tidytext beserta himpunan data tidy_twitter telah dimuat untuk Anda.

Latihan ini adalah bagian dari kursus

Pengantar Analisis Teks di R

Lihat Kursus

Petunjuk latihan

  • Muat paket topicmodels.
  • Ubah hitungan kata per tweet menjadi DTM.
  • Jalankan LDA dengan 2 topik dan Gibbs sampler.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Load the topicmodels package
___

# Cast the word counts by tweet into a DTM
dtm_twitter <- ___ %>% 
  ___(___) %>% 
  ___(___)

# Run an LDA with 2 topics and a Gibbs sampler
lda_out <- LDA(
  ___,
  k = ___,
  method = ___,
  control = list(seed = 42)
)
Edit dan Jalankan Kode