ComeçarComece de graça

Comparando a saída do LDA

Até agora, executamos apenas um LDA com um número específico de tópicos. A saída organizada desse modelo, lda_out_tidy, foi carregada junto com dtm_twitter no seu workspace. Agora, rode um LDA com 3 tópicos e compare as saídas.

> lda_out_tidy

# A tibble: 35,928 x 3
   topic term        beta
   <int> <chr>      <dbl>
 1     1 flight   0.0343 
 2     1 time     0.0102 
 3     2 service  0.00882
 4     1 plane    0.00688
 5     1 trip     0.00614
 6     2 customer 0.00604
 7     1 delayed  0.00596
 8     2 airline  0.00593
 9     1 hours    0.00532
10     1 day      0.00499
# ... with 35,918 more rows

Este exercício faz parte do curso

Introdução à Análise de Texto em R

Ver curso

Instruções do exercício

  • Rode um LDA com 3 tópicos e um amostrador Gibbs (isso pode levar 10 segundos ou mais).
  • Organize (tidy) a matriz de probabilidades das palavras.
  • Ordene os tópicos pelas probabilidades das palavras em ordem decrescente.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Run an LDA with 3 topics and a Gibbs sampler
lda_out2 <- ___(
  ___,
  ___,
  ___,
  control = list(seed = 42)
)

# Tidy the matrix of word probabilities
lda_topics2 <- ___ %>% 
  ___(___)

# Arrange the topics by word probabilities in descending order
___ %>% 
  ___(___)
Editar e executar o código