Datensätze für verteiltes Training vorbereiten
Du hast einen Datensatz für ein Präzisionslandwirtschaftssystem aufbereitet, das Landwirten helfen soll, die Gesundheit ihrer Pflanzen zu überwachen. Jetzt lädst du die Daten, indem du einen DataLoader erstellst, und platzierst die Daten auf GPUs für verteiltes Training, falls GPUs verfügbar sind. Beachte, dass die Übung eigentlich eine CPU benutzt, aber der Code ist für CPUs und GPUs derselbe.
Einige Daten wurden bereits geladen:
- Ein Beispiel
dataset
mit landwirtschaftlichem Bildmaterial - Die Klasse
Accelerator
aus der Bibliothekaccelerate
- Die Klasse
DataLoader
Diese Übung ist Teil des Kurses
Effizientes KI-Modelltraining mit PyTorch
Anleitung zur Übung
- Erstelle eine
dataloader
für die vordefiniertedataset
. - Platziere die
dataloader
mit demaccelerator
Objekt auf den verfügbaren Geräten.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
accelerator = Accelerator()
# Create a dataloader for the pre-defined dataset
dataloader = ____(____, batch_size=32, shuffle=True)
# Place the dataloader on available devices
dataloader = accelerator.____(____)
print(accelerator.device)