Membagi data dengan LightningDataModule
Anda akan melengkapi metode setup dalam sebuah LightningDataModule. Pembagian himpunan data yang tepat memastikan model dilatih pada satu subset dan divalidasi pada subset lain, sehingga mencegah overfitting.
dataset telah diimpor sebelumnya.
Latihan ini merupakan bagian dari kursus
Model AI yang Dapat Diskalakan dengan PyTorch Lightning
Instruksi latihan
- Impor
random_splituntuk membagi himpunan data menjadi pelatihan dan validasi. - Bagi himpunan data menjadi pelatihan (80%) dan validasi (20%) menggunakan
random_split.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Import libraries
import lightning.pytorch as pl
from torch.utils.data import ____
class SplitDataModule(pl.LightningDataModule):
def __init__(self):
super().__init__()
self.train_data = None
self.val_data = None
def setup(self, stage=None):
# Split the dataset into training (80%) and validation (20%)
self.____, self.____ = random_split(dataset, [____, ____])