Himpunan Data PyTorch
Saatnya menyegarkan kembali pengetahuan Anda tentang PyTorch Datasets!
Sebelum pelatihan model dapat dimulai, Anda perlu memuat data dan memberikannya ke model dalam format yang benar. Di PyTorch, hal ini ditangani oleh Dataset dan DataLoader. Mari mulai dengan membangun PyTorch Dataset untuk data kelayakan air minum kita.
Dalam latihan ini, Anda akan mendefinisikan sebuah kelas bernama WaterDataset untuk memuat data dari berkas CSV. Untuk melakukannya, Anda perlu mengimplementasikan tiga metode yang diharapkan PyTorch dimiliki oleh sebuah Dataset:
.__init__()untuk memuat data,.__len__()untuk mengembalikan ukuran data,.__getitem()__untuk mengekstrak fitur dan label untuk satu sampel.
Impor berikut yang Anda perlukan telah disiapkan untuk Anda:
import pandas as pd
from torch.utils.data import Dataset
Latihan ini adalah bagian dari kursus
Deep Learning Lanjutan dengan PyTorch
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
class WaterDataset(Dataset):
def __init__(self, csv_path):
super().__init__()
# Load data to pandas DataFrame
df = ____
# Convert data to a NumPy array and assign to self.data
____ = ____.____