1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do przetwarzania języka naturalnego w R

Connected

ćwiczenie

Analiza wyników LDA

Zbudowano model tematyczny napoleon_model z 5 tematami dla zdań z książki Folwark zwierzęcy, które odnoszą się do głównego bohatera – Napoleona. Pięciu lokalnych autorów przejrzało najważniejsze słowa i zdania dla każdego tematu i zaproponowało odpowiednie etykiety tematyczne.

Aby sfinalizować wyniki, przygotuj podsumowanie statystyk dotyczących poszczególnych tematów. Przedstawisz te wartości razem z etykietami tematycznymi swojemu przełożonemu do oceny.

Instrukcje

100 XP
  • Wyodrębnij macierz gamma z modelu tematycznego napoleon_model.
  • Użyj funkcji z pakietu dplyr, aby utworzyć tibble zawierający dominujący temat dla każdego zdania – nazwij go grouped_gammas.
  • Korzystając z grouped_gammas, policz liczbę zdań najbardziej odpowiadających każdemu tematowi.
  • Korzystając z grouped_gammas, oblicz średnią wartość gamma dla każdego tematu.