Suddividere i dati con LightningDataModule

Completerai il metodo setup in un LightningDataModule. Una suddivisione corretta dell'insieme di dati garantisce che il modello venga addestrato su un sottoinsieme e validato su un altro, evitando l'overfitting.

Il dataset è già stato pre-importato.

Questo esercizio fa parte del corso

Modelli di AI scalabili con PyTorch Lightning

Visualizza corso

Istruzioni dell'esercizio

Importa random_split per suddividere l'insieme di dati in training e validation.
Suddividi l'insieme di dati in training (80%) e validation (20%) usando random_split.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Import libraries 
import lightning.pytorch as pl
from torch.utils.data import ____

class SplitDataModule(pl.LightningDataModule):
    def __init__(self):
        super().__init__()
        self.train_data = None
        self.val_data = None
    def setup(self, stage=None):
        # Split the dataset into training (80%) and validation (20%)
        self.____, self.____ = random_split(dataset, [____, ____])

Modifica ed esegui il codice

Questo esercizio fa parte del corso

Modelli di AI scalabili con PyTorch Lightning

IntermediárioNível de habilidade

4.8+

Inizia il corso gratuitamente

In questo capitolo vedremo come PyTorch Lightning semplifica lo sviluppo e la distribuzione di modelli di AI scalabili. Partendo dai concetti di base, passeremo attraverso la struttura fondamentale di un progetto PyTorch Lightning, includendo componenti essenziali come LightningModule e Trainer, per creare solide basi per soluzioni di AI più avanzate.

Exercise 1: Introduzione a PyTorch Lightning Exercise 2: Introduzione al LightningModule Exercise 3: Eseguire il Lightning Trainer Exercise 4: Definire modelli con LightningModule Exercise 5: Uso del LightningModule Exercise 6: Padroneggiare il metodo init Exercise 7: Perfezionare il metodo forward Exercise 8: Implementare la logica di training Exercise 9: Implementare lo step di training Exercise 10: Configurare l'ottimizzatore Exercise 11: Training ed evaluation

In questo capitolo approfondiremo PyTorch Lightning per gestire i dati in modo efficiente e migliorare l’addestramento del modello. Impareremo a creare workflow di dati modulari e riutilizzabili con LightningDataModule, a valutare correttamente i modelli tramite validazione e test, e a potenziare i processi di training usando i Lightning Callback per automatizzare il miglioramento del modello ed evitare l’overfitting.

Exercise 1: Gestire i dati con LightningDataModule Exercise 2: Suddividere i dati con LightningDataModule

Esercizio attuale

Exercise 3: Creare un DataLoader di training Exercise 4: Integrare validazione e test Exercise 5: Implementare lo step di validazione Exercise 6: Valutare l'accuratezza del modello con Torchmetrics Exercise 7: Migliorare l'addestramento con i callback di Lightning Exercise 8: Classificare i callback di Lightning Exercise 9: Ottimizzare l'addestramento del modello con Lightning

Impara a preparare modelli di deep learning per la messa in produzione rendendoli più snelli e veloci. Questo capitolo introduce tecniche come quantizzazione dinamica, pruning e conversione con TorchScript, aiutandoti a ridurre dimensioni e latenza del modello senza sacrificare l’accuratezza

Exercise 1: Applicare la quantizzazione dinamica Exercise 2: Applica la quantizzazione dinamica Exercise 3: Confrontare le prestazioni del modello quantizzato Exercise 4: Implementare tecniche di pruning del modello Exercise 5: Applica il pruning a un livello lineare Exercise 6: Finalizza il pruning rimuovendo la maschera Exercise 7: Esportare i modelli con TorchScript Exercise 8: Scegliere il metodo di conversione giusto Exercise 9: Ottimizzare i modelli per la scalabilità Exercise 10: Riepilogo: Scalable AI Models with PyTorch Lightning