1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Analýza dat ze sociálních médií v R

Connected

cvičení

Odstranění vlastních stop slov

Populární výrazy v textovém korpusu lze vizualizovat pomocí sloupcových grafů nebo slovních mraků.

Před použitím vizualizačních nástrojů je ale důležité nejprve z korpusu odstranit vlastní stop slova.

V tomto cvičení zkontroluješ frekvence výrazů a odstraníš vlastní stop slova z textového korpusu, který jsi vytvořil/a pro "telemedicine".

Textový korpus je předem načtený jako twt_corpus.

Knihovny qdap a tm jsou pro toto cvičení předem načtené.

Pokyny 1/2

undefined XP
    1
    2
  • Extrahuj frekvence výrazů pro 60 nejčastějších slov z twt_corpus.