1. Nauka
  2. /
  3. Kursy
  4. /
  5. Analiza danych z mediów społecznościowych w R

Connected

ćwiczenie

Usuwanie niestandardowych słów stopu

Popularne terminy w korpusie tekstowym można wizualizować za pomocą wykresów słupkowych lub chmur słów.

Przed użyciem narzędzi do wizualizacji warto jednak najpierw usunąć niestandardowe słowa stopu obecne w korpusie.

W tym ćwiczeniu sprawdzisz częstości terminów i usuniesz niestandardowe słowa stopu z korpusu tekstowego utworzonego dla "telemedicine".

Korpus tekstowy został wstępnie załadowany jako twt_corpus.

Biblioteki qdap i tm zostały wstępnie załadowane na potrzeby tego ćwiczenia.

Instrukcje 1/2

undefined XP
    1
    2
  • Wyodrębnij częstości terminów dla 60 najczęstszych słów z twt_corpus.