CommencerCommencer gratuitement

Visualiser des thèmes

En nous appuyant sur ce que nous avons vu dans les chapitres précédents, visualisons les thèmes produits par le LDA.

Cet exercice fait partie du cours

Introduction à l’analyse de texte en R

Afficher le cours

Instructions

  • Conservez les 10 probabilités de mots les plus élevées par thème.
  • Créez term2, un facteur ordonnant term selon la probabilité du mot.
  • Tracez term2 et les probabilités des mots.
  • Répartissez l’histogramme en facettes par (c.-à-d. ~) thème.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

word_probs <- lda_topics %>%
  # Keep the top 10 highest word probabilities by topic
  ___(___) %>% 
  ___(___) %>% 
  ___() %>%
  # Create term2, a factor ordered by word probability
  ___(term2 = ___(___))

# Plot term2 and the word probabilities
___(___) +
  geom_col() +
  # Facet the bar plot by topic
  ___(___, scales = "free") +
  coord_flip()
Modifier et exécuter le code