1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do analizy tekstu w R

Connected

ćwiczenie

Tworzenie DTM

Utwórz macierz dokumentów i słów (DTM) na podstawie danych tidy_twitter. W tym przypadku każdy tweet traktowany jest jako osobny dokument. Wyświetl tidy_twitter w konsoli, aby sprawdzić nazwy kolumn.

Instrukcje

100 XP
  • Zacznij od oczyszczonych danych z Twittera.
  • Zlicz, ile razy każde słowo pojawia się w danym tweecie.
  • Użyj tych zliczeń, aby utworzyć DTM.