Ajustando uma LDA
É hora de rodar seu primeiro modelo de tópicos! Como discutido, os três argumentos adicionais da função LDA() são essenciais para executar corretamente um modelo de tópicos. Observe que rodar a função LDA() pode levar cerca de 10 segundos. Os pacotes tidyverse e tidytext, junto com o conjunto de dados tidy_twitter, já foram carregados para você.
Este exercício faz parte do curso
Introdução à Análise de Texto em R
Instruções do exercício
- Carregue o pacote
topicmodels. - Converta as contagens de palavras por tweet em um DTM.
- Rode uma LDA com 2 tópicos usando um amostrador de Gibbs.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Load the topicmodels package
___
# Cast the word counts by tweet into a DTM
dtm_twitter <- ___ %>%
___(___) %>%
___(___)
# Run an LDA with 2 topics and a Gibbs sampler
lda_out <- LDA(
___,
k = ___,
method = ___,
control = list(seed = 42)
)