Preparar conjuntos de datos para el entrenamiento distribuido
Has preprocesado un conjunto de datos para un sistema de agricultura de precisión que ayuda a los agricultores a controlar la salud de los cultivos. Ahora cargarás los datos creando un DataLoader y colocarás los datos en las GPUs para el entrenamiento distribuido, si hay GPUs disponibles. Ten en cuenta que el ejercicio utiliza realmente una CPU, pero el código es el mismo para CPU y GPU.
Se han precargado algunos datos:
- Una muestra
dataset
con imágenes agrícolas - La clase
Accelerator
de la bibliotecaaccelerate
- La clase
DataLoader
Este ejercicio forma parte del curso
Entrenamiento eficiente de modelos de IA con PyTorch
Instrucciones del ejercicio
- Crea un
dataloader
para eldataset
predefinido. - Coloca el
dataloader
en los dispositivos disponibles utilizando el objetoaccelerator
.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
accelerator = Accelerator()
# Create a dataloader for the pre-defined dataset
dataloader = ____(____, batch_size=32, shuffle=True)
# Place the dataloader on available devices
dataloader = accelerator.____(____)
print(accelerator.device)