MulaiMulai sekarang secara gratis

Membagi data dengan LightningDataModule

Anda akan melengkapi metode setup dalam sebuah LightningDataModule. Pembagian himpunan data yang tepat memastikan model dilatih pada satu subset dan divalidasi pada subset lain, sehingga mencegah overfitting.

dataset telah diimpor sebelumnya.

Latihan ini adalah bagian dari kursus

Model AI yang Dapat Diskalakan dengan PyTorch Lightning

Lihat Kursus

Petunjuk latihan

  • Impor random_split untuk membagi himpunan data menjadi pelatihan dan validasi.
  • Bagi himpunan data menjadi pelatihan (80%) dan validasi (20%) menggunakan random_split.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import libraries 
import lightning.pytorch as pl
from torch.utils.data import ____

class SplitDataModule(pl.LightningDataModule):
    def __init__(self):
        super().__init__()
        self.train_data = None
        self.val_data = None
    def setup(self, stage=None):
        # Split the dataset into training (80%) and validation (20%)
        self.____, self.____ = random_split(dataset, [____, ____])
Edit dan Jalankan Kode