ćwiczenie

Pipeline do przetwarzania języka Szekspira

Zespół PyBooks chce przetworzyć obszerną bibliotekę tekstów Szekspira do dalszej analizy. Najefektywniejszym sposobem jest zbudowanie potoku przetwarzania tekstu, zaczynając od kroków wstępnego przetwarzania.

Następujące elementy zostały już załadowane: torch, nltk, stopwords, PorterStemmer, get_tokenizer.

Dane tekstowe Szekspira są zapisane jako shakespeare, a zdania zostały już wyodrębnione.

Instrukcje 1/3

undefined XP

1

2

3

Utwórz listę unikalnych angielskich stop słów i zapisz ją do stop_words.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje 1/3

ćwiczenie