PyTorch Veri Kümesi
PyTorch Datasets bilgini tazeleme zamanı!
Model eğitimine başlamadan önce, veriyi yükleyip modele doğru formatta iletmen gerekir. PyTorch'ta bu işi Datasets ve DataLoaders üstlenir. Hadi su içilebilirliği (water potability) verimiz için bir PyTorch Dataset oluşturarak başlayalım.
Bu egzersizde, veriyi bir CSV dosyasından yüklemek için WaterDataset adlı bir sınıf tanımlayacaksın. Bunu yapmak için, PyTorch'un bir Dataset'te bulunmasını beklediği üç yöntemi uygulaman gerekiyor:
- Veriyi yüklemek için
.__init__(), - Veri boyutunu döndürmek için
.__len__(), - Tek bir örnek için özellikleri ve etiketi çıkarmak üzere
.__getitem()__.
İhtiyacın olan aşağıdaki içe aktarmalar senin için zaten yapıldı:
import pandas as pd
from torch.utils.data import Dataset
Bu egzersiz
PyTorch ile Orta Düzey Deep Learning
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
class WaterDataset(Dataset):
def __init__(self, csv_path):
super().__init__()
# Load data to pandas DataFrame
df = ____
# Convert data to a NumPy array and assign to self.data
____ = ____.____