1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do analizy tekstu w R

Connected

ćwiczenie

Tokenizacja i zliczanie

Przeanalizuj zawartość tweetów lotniczych ze zbioru twitter_data, korzystając ze zliczania słów. Treść każdego tweeta znajduje się w kolumnie tweet_text.

Instrukcje

100 XP
  • Wczytaj pakiety tidyverse i tidytext.
  • Dokonaj tokenizacji tweetów z kolumny tweet_text.
  • Oblicz liczbę wystąpień słów na podstawie stokenizowanego tekstu.
  • Posortuj wyniki malejąco według liczby wystąpień.