1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do analizy tekstu w R

Connected

ćwiczenie

Porównywanie wyników LDA

Do tej pory uruchomiliśmy tylko jedno LDA z określoną liczbą tematów. Uporządkowane wyniki tego modelu, lda_out_tidy, zostały wczytane do obszaru roboczego razem z dtm_twitter. Teraz uruchom LDA z 3 tematami i porównaj wyniki.

> lda_out_tidy

# A tibble: 35,928 x 3
   topic term        beta
   <int> <chr>      <dbl>
 1     1 flight   0.0343 
 2     1 time     0.0102 
 3     2 service  0.00882
 4     1 plane    0.00688
 5     1 trip     0.00614
 6     2 customer 0.00604
 7     1 delayed  0.00596
 8     2 airline  0.00593
 9     1 hours    0.00532
10     1 day      0.00499
# ... with 35,918 more rows

Instrukcje

100 XP
  • Uruchom LDA z 3 tematami i próbnikiem Gibbsa (może to potrwać 10 sekund lub dłużej).
  • Uporządkuj macierz prawdopodobieństw słów przy użyciu funkcji tidy().
  • Posortuj tematy według prawdopodobieństw słów w porządku malejącym.