Een train DataLoader maken

Nu we onze gegevensset hebben gesplitst, moeten we een data loader definiëren die tijdens het trainen batches data aanlevert. DataLoader laadt data efficiënt in het geheugen en maakt schudden mogelijk voor betere generalisatie. In deze oefening maak je de methode train_dataloader af.

Deze oefening maakt deel uit van de cursus

Schaalbare AI-modellen met PyTorch Lightning

Oefeninstructies

Importeer de DataLoader.
Retourneer een DataLoader die self.train_data laadt en schudden inschakelt voor betere generalisatie.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Import libraries
from torch.utils.data import ____
import lightning.pytorch as pl

class LoaderDataModule(pl.LightningDataModule):
    def __init__(self):
        super().__init__()
        self.train_data = None
        self.val_data = None
    def setup(self, stage=None):
        self.train_data, self.val_data = random_split(dataset, [80, 20])
    def train_dataloader(self):
      	# Complete DataLoader
        return ____(____, batch_size=16, shuffle=____)

Code bewerken en uitvoeren

Deze oefening maakt deel uit van de cursus

Schaalbare AI-modellen met PyTorch Lightning

SkillTag.level.intermediateSkillTag.label

4.8+

Begin gratis met de cursus

In dit hoofdstuk ontdek je hoe PyTorch Lightning de ontwikkeling en deployment van schaalbare AI-modellen vereenvoudigt. We beginnen met de basisconcepten en lopen door de kernstructuur van een PyTorch Lightning-project, inclusief essentiële componenten zoals de LightningModule en de Trainer, om een stevige basis te leggen voor meer geavanceerde AI-oplossingen.

Exercise 1: Introductie tot PyTorch Lightning Exercise 2: Kennismaken met de LightningModule Exercise 3: De Lightning Trainer uitvoeren Exercise 4: Modellen definiëren met LightningModule Exercise 5: Gebruik van de LightningModule Exercise 6: De init-methode onder de knie krijgen Exercise 7: De forward-methode perfectioneren Exercise 8: Trainingslogica implementeren Exercise 9: De trainingstap implementeren Exercise 10: De optimizer configureren Exercise 11: Trainen en evalueren

We duiken in dit hoofdstuk dieper in PyTorch Lightning om data efficiënt te beheren en het trainen van modellen te verfijnen. Je leert hoe je modulaire en herbruikbare dataworkflows maakt met LightningDataModule, hoe je je modellen nauwkeurig evalueert via validatie en testen, en hoe je het trainingsproces verbetert met Lightning Callbacks om modelverbetering te automatiseren en overfitting te voorkomen.

Exercise 1: Data beheren met LightningDataModule Exercise 2: Gegevens splitsen met LightningDataModule Exercise 3: Een train DataLoader maken

Huidige oefening

Exercise 4: Validatie en testen toevoegen Exercise 5: De validatiestap implementeren Exercise 6: Modelnauwkeurigheid evalueren met Torchmetrics Exercise 7: Training verbeteren met Lightning-callbacks Exercise 8: Lightning-callbacks classificeren Exercise 9: Training van modellen optimaliseren met Lightning

Leer deep learning-modellen klaar te maken voor deployment in de praktijk door ze compacter en sneller te maken. Dit hoofdstuk introduceert technieken zoals dynamische kwantisatie, pruning en conversie met TorchScript, zodat je de modelgrootte en latentie kunt verminderen zonder aan nauwkeurigheid in te leveren

Exercise 1: Dynamische kwantisatie toepassen Exercise 2: Pas dynamische quantization toe Exercise 3: Prestaties van het gequantiseerde model vergelijken Exercise 4: Pruningtechnieken voor modellen toepassen Exercise 5: Pas pruning toe op een lineaire laag Exercise 6: Rond het snoeien af door het masker te verwijderen Exercise 7: Modellen exporteren met TorchScript Exercise 8: De juiste conversiemethode kiezen Exercise 9: Modellen optimaliseren voor schaalbaarheid Exercise 10: Samenvatting: Scalable AI Models with PyTorch Lightning