1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie głębokie dla tekstu z PyTorch

Connected

ćwiczenie

Koder języka szekspirowskiego

Masz już wstępnie przetworzone teksty szekspirowskie – teraz czas zakodować je w postaci numerycznej. Zdefiniujesz kolejne kroki kodowania, a następnie złożysz je w potok przetwarzania. Aby sprawnie obsługiwać duże ilości danych i efektywnie przeprowadzić kodowanie, skorzystasz z klas Dataset i DataLoader z PyTorch, które umożliwiają tworzenie partii danych i ich losowe mieszanie.

Następujące elementy zostały już załadowane: torch, nltk, stopwords, PorterStemmer, get_tokenizer, CountVectorizer, Dataset, DataLoader oraz preprocess_sentences.

Dostępna jest też zmienna processed_shakespeare zawierająca przetworzony tekst szekspirowski.

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Zdefiniuj klasę zbioru danych ShakespeareDataset i uzupełnij metody __init__ oraz __getitem__.