Criando um DataLoader de trem
Agora que dividimos nosso conjunto de dados, precisamos definir um carregador de dados para fornecer lotes de dados durante o treinamento. O DataLoader
carrega os dados na memória de forma eficiente e permite a reorganização para uma melhor generalização. Neste exercício, você vai completar o método “ train_dataloader
”.
Este exercício faz parte do curso
Modelos de IA escaláveis com PyTorch Lightning
Instruções do exercício
- Importa o arquivo
DataLoader
. - Retorna um objeto `
DataLoader
que carrega
self.train_data
`, permitindo a aleatoriedade para uma melhor generalização.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import libraries
from torch.utils.data import ____
import lightning.pytorch as pl
class LoaderDataModule(pl.LightningDataModule):
def __init__(self):
super().__init__()
self.train_data = None
self.val_data = None
def setup(self, stage=None):
self.train_data, self.val_data = random_split(dataset, [80, 20])
def train_dataloader(self):
# Complete DataLoader
return ____(____, batch_size=16, shuffle=____)