Membagi data dengan LightningDataModule
Anda akan melengkapi metode setup dalam sebuah LightningDataModule. Pembagian himpunan data yang tepat memastikan model dilatih pada satu subset dan divalidasi pada subset lain, sehingga mencegah overfitting.
dataset telah diimpor sebelumnya.
Latihan ini adalah bagian dari kursus
Model AI yang Dapat Diskalakan dengan PyTorch Lightning
Petunjuk latihan
- Impor
random_splituntuk membagi himpunan data menjadi pelatihan dan validasi. - Bagi himpunan data menjadi pelatihan (80%) dan validasi (20%) menggunakan
random_split.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import libraries
import lightning.pytorch as pl
from torch.utils.data import ____
class SplitDataModule(pl.LightningDataModule):
def __init__(self):
super().__init__()
self.train_data = None
self.val_data = None
def setup(self, stage=None):
# Split the dataset into training (80%) and validation (20%)
self.____, self.____ = random_split(dataset, [____, ____])