CommencerCommencez gratuitement

Sujets en tant que probabilités de mots

lda_topics contient les sujets produits par une exécution de LDA sur les données Twitter. Rappelez-vous que chaque sujet est un ensemble de probabilités de mots pour l’ensemble des mots uniques utilisés dans le corpus. Ici, chaque tweet constitue son propre document et la colonne beta contient les probabilités des mots.

Cet exercice fait partie du cours

<cours>Introduction à l’analyse de texte en R</cours>
Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Print the output from LDA run
___
Modifier et exécuter le code