Preparar conjuntos de dados para treinamento distribuído
Você pré-processou um conjunto de dados para um sistema de agricultura de precisão para ajudar os agricultores a monitorar a saúde das culturas. Agora você carregará os dados criando um DataLoader e colocará os dados em GPUs para treinamento distribuído, se houver GPUs disponíveis. Observe que o exercício realmente usa uma CPU, mas o código é o mesmo para CPUs e GPUs.
Alguns dados foram pré-carregados:
- Uma amostra
dataset
com imagens agrícolas - A classe
Accelerator
da bibliotecaaccelerate
- A classe
DataLoader
Este exercício faz parte do curso
Treinamento eficiente de modelos de IA com PyTorch
Instruções do exercício
- Crie um
dataloader
para odataset
predefinido. - Coloque o
dataloader
nos dispositivos disponíveis usando o objetoaccelerator
.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
accelerator = Accelerator()
# Create a dataloader for the pre-defined dataset
dataloader = ____(____, batch_size=32, shuffle=True)
# Place the dataloader on available devices
dataloader = accelerator.____(____)
print(accelerator.device)