Shakespeare dili kodlayıcı
Ön işlenmiş Shakespeare metni elindeyken, şimdi bunu sayısal bir temsile kodlaman gerekiyor. Boru hattını (pipeline) bir araya getirmeden önce kodlama adımlarını tanımlamalısın. Büyük miktarda veriyi daha iyi yönetmek ve kodlamayı verimli şekilde gerçekleştirmek için, PyTorch'un Dataset ve DataLoader bileşenlerini kullanarak veriyi gruplar (batch) halinde işleyecek ve karıştıracaksın (shuffle).
Senin için şu paketler yüklendi:
torch, nltk, stopwords, PorterStemmer, get_tokenizer, CountVectorizer, Dataset, DataLoader ve preprocess_sentences.
Shakespeare metninden elde edilen processed_shakespeare değişkeni de kullanımına hazır.
Bu egzersiz, kursun bir parçasıdır
PyTorch ile Metin için Deep Learning
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Define your Dataset class
class ____(Dataset):
def __init__(self, data):
self.data = ____
def __len__(self):
return len(self.data)
def __getitem__(self, idx):
return self.____[____]