Topics visualiseren
Met wat we in eerdere hoofdstukken hebben behandeld, gaan we de topics die door de LDA zijn geproduceerd visualiseren.
Deze oefening maakt deel uit van de cursus
Introductie tot tekstanalyse in R
Oefeninstructies
- Behoud per topic de 10 hoogste woordkansen.
- Maak
term2, een factor dietermordent op woordkans. - Plot
term2en de woordkansen. - Facetteer de staafgrafiek per (d.w.z.
~) topic.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
word_probs <- lda_topics %>%
# Keep the top 10 highest word probabilities by topic
___(___) %>%
___(___) %>%
___() %>%
# Create term2, a factor ordered by word probability
___(term2 = ___(___))
# Plot term2 and the word probabilities
___(___) +
geom_col() +
# Facet the bar plot by topic
___(___, scales = "free") +
coord_flip()