cvičení

Pipeline pro předzpracování shakespearovského textu

Tým v PyBooks chce zpracovat rozsáhlou knihovnu shakespearovských textů pro další analýzu. Nejefektivnější způsob, jak to udělat, je pomocí pipeline pro zpracování textu – začínáme kroky předzpracování.

Následující knihovny a moduly jsou už načtené: torch, nltk, stopwords, PorterStemmer, get_tokenizer.

Shakespearovská textová data jsou uložena v proměnné shakespeare a věty už byly extrahovány.

Pokyny 1/3

undefined XP

1

2

3

Vytvoř seznam jedinečných anglických stop slov a ulož ho do proměnné stop_words.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny 1/3

cvičení