Visualiser des thèmes
En nous appuyant sur ce que nous avons vu dans les chapitres précédents, visualisons les thèmes produits par le LDA.
Cet exercice fait partie du cours
Introduction à l’analyse de texte en R
Instructions
- Conservez les 10 probabilités de mots les plus élevées par thème.
- Créez
term2, un facteur ordonnanttermselon la probabilité du mot. - Tracez
term2et les probabilités des mots. - Répartissez l’histogramme en facettes par (c.-à-d.
~) thème.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
word_probs <- lda_topics %>%
# Keep the top 10 highest word probabilities by topic
___(___) %>%
___(___) %>%
___() %>%
# Create term2, a factor ordered by word probability
___(term2 = ___(___))
# Plot term2 and the word probabilities
___(___) +
geom_col() +
# Facet the bar plot by topic
___(___, scales = "free") +
coord_flip()