Ajuster une LDA
Il est temps d’exécuter votre premier modèle thématique ! Comme expliqué, les trois arguments supplémentaires de la fonction LDA() sont essentiels pour exécuter correctement un modèle thématique. Notez que l’exécution de LDA() peut prendre environ 10 secondes. Les packages tidyverse et tidytext, ainsi que le jeu de données tidy_twitter, ont été chargés pour vous.
Cet exercice fait partie du cours
Introduction à l’analyse de texte en R
Instructions
- Chargez le package
topicmodels. - Convertissez les décomptes de mots par tweet en DTM.
- Exécutez une LDA avec 2 sujets et un échantillonneur de Gibbs.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load the topicmodels package
___
# Cast the word counts by tweet into a DTM
dtm_twitter <- ___ %>%
___(___) %>%
___(___)
# Run an LDA with 2 topics and a Gibbs sampler
lda_out <- LDA(
___,
k = ___,
method = ___,
control = list(seed = 42)
)