1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Deep Learning for Text with PyTorch

Connected

cvičení

Pipeline pro předzpracování shakespearovského textu

Tým v PyBooks chce zpracovat rozsáhlou knihovnu shakespearovských textů pro další analýzu. Nejefektivnější způsob, jak to udělat, je pomocí pipeline pro zpracování textu – začínáme kroky předzpracování.

Následující knihovny a moduly jsou už načtené: torch, nltk, stopwords, PorterStemmer, get_tokenizer.

Shakespearovská textová data jsou uložena v proměnné shakespeare a věty už byly extrahovány.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Vytvoř seznam jedinečných anglických stop slov a ulož ho do proměnné stop_words.