Aan de slagGa gratis aan de slag

Topics visualiseren

Met wat we in eerdere hoofdstukken hebben behandeld, gaan we de topics die door de LDA zijn geproduceerd visualiseren.

Deze oefening maakt deel uit van de cursus

Introductie tot tekstanalyse in R

Cursus bekijken

Oefeninstructies

  • Behoud per topic de 10 hoogste woordkansen.
  • Maak term2, een factor die term ordent op woordkans.
  • Plot term2 en de woordkansen.
  • Facetteer de staafgrafiek per (d.w.z. ~) topic.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

word_probs <- lda_topics %>%
  # Keep the top 10 highest word probabilities by topic
  ___(___) %>% 
  ___(___) %>% 
  ___() %>%
  # Create term2, a factor ordered by word probability
  ___(term2 = ___(___))

# Plot term2 and the word probabilities
___(___) +
  geom_col() +
  # Facet the bar plot by topic
  ___(___, scales = "free") +
  coord_flip()
Code bewerken en uitvoeren