1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do przetwarzania języka naturalnego w R

Connected

ćwiczenie

Przypisywanie tematów do dokumentów

Tworzenie modeli LDA nie ma sensu, jeśli nie potrafisz interpretować i wykorzystywać ich wyników. Otrzymujesz wyniki działania modelu LDA, sentence_lda, na zbiorze zdań pig_sentences. Aby w pełni zrozumieć rezultaty analizy LDA, musisz zbadać zarówno macierz beta – zawierającą najważniejsze słowa dla każdego tematu – jak i macierz gamma – zawierającą dominujące tematy dla każdego dokumentu.

Wykorzystaj swoją wiedzę o tych dwóch macierzach: wyodrębnij wyniki dla konkretnego tematu i sprawdź, czy dane wyjściowe spełniają oczekiwania.

Instrukcje

100 XP
  • Utwórz tibble dla macierzy beta i gamma.
  • Zbadaj temat 5, sprawdzając najważniejsze słowa dla tego tematu – posortuj wyniki malejąco według wartości beta.
  • Zbadaj temat 5, sprawdzając, które zdania najlepiej do niego pasują – posortuj wyniki malejąco według wartości gamma.