CommencerCommencer gratuitement

Sujets en tant que probabilités de mots

lda_topics contient les sujets produits par une exécution de LDA sur les données Twitter. Rappelez-vous que chaque sujet est un ensemble de probabilités de mots pour l’ensemble des mots uniques utilisés dans le corpus. Ici, chaque tweet constitue son propre document et la colonne beta contient les probabilités des mots.

Cet exercice fait partie du cours

Introduction à l’analyse de texte en R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Print the output from LDA run
___
Modifier et exécuter le code