1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Deep Learning for Text with PyTorch

Connected

cvičení

Shakespearovský jazykový enkodér

Máš k dispozici předzpracovaný Shakespearovský text a teď ho potřebuješ zakódovat do číselné reprezentace. Nejprve si nadefinuješ kroky kódování a pak je složíš dohromady do pipeline. Pro efektivní práci s velkým množstvím dat využiješ PyTorchovy třídy Dataset a DataLoader, které se postarají o dávkování a náhodné míchání dat.

Následující jsou pro tebe již načteny: torch, nltk, stopwords, PorterStemmer, get_tokenizer, CountVectorizer, Dataset, DataLoader a preprocess_sentences.

K dispozici máš také processed_shakespeare ze Shakespearovského textu.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Definuj třídu datové sady ShakespeareDataset a dokonči metody __init__ a __getitem__.