MulaiMulai sekarang secara gratis

Himpunan Data PyTorch

Saatnya menyegarkan kembali pengetahuan Anda tentang PyTorch Datasets!

Sebelum pelatihan model dapat dimulai, Anda perlu memuat data dan memberikannya ke model dalam format yang benar. Di PyTorch, hal ini ditangani oleh Dataset dan DataLoader. Mari mulai dengan membangun PyTorch Dataset untuk data kelayakan air minum kita.

Dalam latihan ini, Anda akan mendefinisikan sebuah kelas bernama WaterDataset untuk memuat data dari berkas CSV. Untuk melakukannya, Anda perlu mengimplementasikan tiga metode yang diharapkan PyTorch dimiliki oleh sebuah Dataset:

  • .__init__() untuk memuat data,
  • .__len__() untuk mengembalikan ukuran data,
  • .__getitem()__ untuk mengekstrak fitur dan label untuk satu sampel.

Impor berikut yang Anda perlukan telah disiapkan untuk Anda:

import pandas as pd
from torch.utils.data import Dataset

Latihan ini adalah bagian dari kursus

Deep Learning Lanjutan dengan PyTorch

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

class WaterDataset(Dataset):
    def __init__(self, csv_path):
        super().__init__()
        # Load data to pandas DataFrame
        df = ____
        # Convert data to a NumPy array and assign to self.data
        ____ = ____.____
Edit dan Jalankan Kode