1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza danych z mediów społecznościowych w R

Connected

ćwiczenie

Tworzenie modelu tematycznego

Modelowanie tematyczne polega na automatycznym wykrywaniu tematów w dużych zbiorach tekstu.

Modele tematyczne tworzone na podstawie treści tweetów pozwalają szybko podsumować ogromne ilości informacji i wyodrębnić z nich odrębne tematy.

W tym ćwiczeniu wyodrębnisz odrębne tematy z tweetów dotyczących "Climate change".

Macierz DTM tweetów na temat "Climate change" została wstępnie załadowana jako dtm_climate_new.

Biblioteka topicmodels jest już załadowana na potrzeby tego ćwiczenia.

Instrukcje 1/2

undefined XP
  • 1
    • Utwórz model tematyczny z 5 tematami na podstawie macierzy DTM, używając metody Latent Dirichlet Allocation (LDA).
    • Wybierz i wyświetl 10 najważniejszych terminów w modelu tematycznym.
  • 2
    • Tym razem utwórz model tematyczny z czterema tematami na podstawie macierzy DTM, ponownie używając LDA.
    • Wybierz i wyświetl 6 najważniejszych terminów w nowym modelu tematycznym.