Membagi data dengan LightningDataModule

Anda akan melengkapi metode setup dalam sebuah LightningDataModule. Pembagian himpunan data yang tepat memastikan model dilatih pada satu subset dan divalidasi pada subset lain, sehingga mencegah overfitting.

dataset telah diimpor sebelumnya.

Latihan ini merupakan bagian dari kursus

Model AI yang Dapat Diskalakan dengan PyTorch Lightning

Instruksi latihan

Impor random_split untuk membagi himpunan data menjadi pelatihan dan validasi.
Bagi himpunan data menjadi pelatihan (80%) dan validasi (20%) menggunakan random_split.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Import libraries 
import lightning.pytorch as pl
from torch.utils.data import ____

class SplitDataModule(pl.LightningDataModule):
    def __init__(self):
        super().__init__()
        self.train_data = None
        self.val_data = None
    def setup(self, stage=None):
        # Split the dataset into training (80%) and validation (20%)
        self.____, self.____ = random_split(dataset, [____, ____])

Edit dan Jalankan Kode

Latihan ini merupakan bagian dari kursus

Model AI yang Dapat Diskalakan dengan PyTorch Lightning

SkillTag.level.intermediateSkillTag.label

4.8+

Mulai Kursus Gratis

Pada bab ini, kita akan mengeksplorasi bagaimana PyTorch Lightning menyederhanakan pengembangan dan penerapan model AI yang dapat diskalakan. Dimulai dari konsep dasar, kita akan membahas struktur inti proyek PyTorch Lightning, termasuk komponen penting seperti LightningModule dan Trainer, untuk membangun fondasi yang kuat bagi solusi AI yang lebih maju.

Exercise 1: Pengantar PyTorch Lightning Exercise 2: Mengenal LightningModule Exercise 3: Menjalankan Lightning Trainer Exercise 4: Mendefinisikan model dengan LightningModule Exercise 5: Penggunaan LightningModule Exercise 6: Menguasai metode init Exercise 7: Menyempurnakan metode forward Exercise 8: Menerapkan logika pelatihan Exercise 9: Mengimplementasikan langkah pelatihan Exercise 10: Mengonfigurasi pengoptimal Exercise 11: Melatih dan mengevaluasi

Kita akan menyelami PyTorch Lightning lebih dalam untuk mengelola data secara efisien dan menyempurnakan pelatihan model pada bab ini. Kita akan mempelajari cara membuat alur kerja data yang modular dan dapat digunakan ulang dengan LightningDataModule, mengevaluasi model Anda secara akurat melalui validasi dan pengujian, serta meningkatkan proses pelatihan menggunakan Lightning Callback untuk mengotomatiskan perbaikan model dan mencegah overfitting.

Exercise 1: Mengelola data dengan LightningDataModule Exercise 2: Membagi data dengan LightningDataModule

Latihan Saat Ini

Exercise 3: Membuat DataLoader pelatihan Exercise 4: Menerapkan validasi dan pengujian Exercise 5: Mengimplementasikan langkah validasi Exercise 6: Evaluasi akurasi model menggunakan Torchmetrics Exercise 7: Meningkatkan pelatihan dengan Lightning callbacks Exercise 8: Mengklasifikasikan callback Lightning Exercise 9: Mengoptimalkan pelatihan model dengan Lightning

Pelajari menyiapkan model deep learning untuk penerapan di dunia nyata dengan membuatnya lebih ringkas dan cepat. Bab ini memperkenalkan teknik seperti dynamic quantization, pruning, dan konversi TorchScript, yang membantu Anda mengurangi ukuran model dan latensi tanpa mengorbankan akurasi.

Exercise 1: Menerapkan kuantisasi dinamis Exercise 2: Terapkan kuantisasi dinamis Exercise 3: Membandingkan kinerja model terkuantisasi Exercise 4: Menerapkan teknik pruning model Exercise 5: Terapkan pruning pada lapisan linear Exercise 6: Finalisasi pruning dengan menghapus mask Exercise 7: Mengekspor model dengan TorchScript Exercise 8: Memilih metode konversi yang tepat Exercise 9: Mengoptimalkan model untuk skalabilitas Exercise 10: Rekap: Model AI yang Dapat Diskalakan dengan PyTorch Lightning