ComenzarEmpieza gratis

Comparar la salida de LDA

Solo hemos ejecutado un único LDA con un número específico de temas. La salida ordenada de ese modelo, lda_out_tidy, se ha cargado junto con dtm_twitter en tu espacio de trabajo. Ahora ejecuta un LDA con 3 temas y compara las salidas.

> lda_out_tidy

# A tibble: 35,928 x 3
   topic term        beta
   <int> <chr>      <dbl>
 1     1 flight   0.0343 
 2     1 time     0.0102 
 3     2 service  0.00882
 4     1 plane    0.00688
 5     1 trip     0.00614
 6     2 customer 0.00604
 7     1 delayed  0.00596
 8     2 airline  0.00593
 9     1 hours    0.00532
10     1 day      0.00499
# ... with 35,918 more rows

Este ejercicio forma parte del curso

Introducción al análisis de texto en R

Ver curso

Instrucciones del ejercicio

  • Ejecuta un LDA con 3 temas y un muestreador Gibbs (puede tardar 10 segundos o más).
  • Ordena la matriz de probabilidades de palabras.
  • Ordena los temas por probabilidades de palabras en orden descendente.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Run an LDA with 3 topics and a Gibbs sampler
lda_out2 <- ___(
  ___,
  ___,
  ___,
  control = list(seed = 42)
)

# Tidy the matrix of word probabilities
lda_topics2 <- ___ %>% 
  ___(___)

# Arrange the topics by word probabilities in descending order
___ %>% 
  ___(___)
Editar y ejecutar código