Shakespeare dili kodlayıcı
Ön işlenmiş Shakespeare metni elindeyken, şimdi bunu sayısal bir temsile kodlaman gerekiyor. Boru hattını (pipeline) bir araya getirmeden önce kodlama adımlarını tanımlamalısın. Büyük miktarda veriyi daha iyi yönetmek ve kodlamayı verimli şekilde gerçekleştirmek için, PyTorch'un Dataset ve DataLoader bileşenlerini kullanarak veriyi gruplar (batch) halinde işleyecek ve karıştıracaksın (shuffle).
Senin için şu paketler yüklendi:
torch, nltk, stopwords, PorterStemmer, get_tokenizer, CountVectorizer, Dataset, DataLoader ve preprocess_sentences.
Shakespeare metninden elde edilen processed_shakespeare değişkeni de kullanımına hazır.
Bu egzersiz
PyTorch ile Metin için Deep Learning
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Define your Dataset class
class ____(Dataset):
def __init__(self, data):
self.data = ____
def __len__(self):
return len(self.data)
def __getitem__(self, idx):
return self.____[____]