Sujets en tant que probabilités de mots
lda_topics contient les sujets produits par une exécution de LDA sur les données Twitter. Rappelez-vous que chaque sujet est un ensemble de probabilités de mots pour l’ensemble des mots uniques utilisés dans le corpus. Ici, chaque tweet constitue son propre document et la colonne beta contient les probabilités des mots.
Cet exercice fait partie du cours
Introduction à l’analyse de texte en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Print the output from LDA run
___