Memvisualisasikan topik
Dengan memanfaatkan materi pada bab-bab sebelumnya, mari memvisualisasikan topik yang dihasilkan oleh LDA.
Latihan ini adalah bagian dari kursus
Pengantar Analisis Teks di R
Petunjuk latihan
- Pertahankan 10 probabilitas kata tertinggi per topik.
- Buat
term2, sebuah faktor yang mengurutkantermberdasarkan probabilitas kata. - Plot
term2dan probabilitas kata. - Buat facet bagan batang berdasarkan (yaitu,
~) topik.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
word_probs <- lda_topics %>%
# Keep the top 10 highest word probabilities by topic
___(___) %>%
___(___) %>%
___() %>%
# Create term2, a factor ordered by word probability
___(term2 = ___(___))
# Plot term2 and the word probabilities
___(___) +
geom_col() +
# Facet the bar plot by topic
___(___, scales = "free") +
coord_flip()