1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do przetwarzania języka naturalnego w R

Connected

ćwiczenie

Ćwiczenie z LDA

Chcesz odkryć wspólne wątki związane z postacią Napoleona w swojej ulubionej nowej książce – „Folwark zwierzęcy". Napoleon to świnia, która przekonuje swoich towarzyszy do obalenia ludzkich przywódców, a ostatecznie sama zostaje nowym przywódcą Folwarku.

Wyodrębniono wszystkie zdania zawierające imię Napoleona – pig_sentences – oraz przygotowano stokenizowaną wersję tych zdań z usuniętymi słowami stopowymi i zastosowanym stemmingiem: pig_tokens. Przeprowadź LDA na tych zdaniach i przejrzyj najważniejsze słowa powiązane z wybranymi tematami.

Instrukcje

100 XP
  • Przeprowadź LDA na macierzy pig_matrix, identyfikując 10 tematów. Ustaw ziarno losowości na 1111, aby zapewnić odtwarzalność wyników.
  • Wyodrębnij macierz beta z wyników.
  • Przefiltruj macierz beta do tematu 2 i posortuj wartości malejąco według wartości beta.
  • Przefiltruj macierz beta do tematu 3 i posortuj wartości malejąco według wartości beta.