1. 学ぶ
  2. /
  3. コース
  4. /
  5. PyTorch による効率的な AI モデルトレーニング

Connected

演習

Accelerator を使ったローカル SGD

言語翻訳モデルのメモリ使用量を最適化するために、勾配累積(gradient accumulation)と勾配チェックポインティング(gradient checkpointing)を実装しました。しかし、トレーニングがまだ少し遅いため、デバイス間の通信効率を向上させるために、トレーニングループにローカル SGD を追加することにしました。ローカル SGD を使ったトレーニングループを構築しましょう!

model、train_dataloader、accelerator はあらかじめ定義されており、LocalSGD はインポート済みです。

指示

100 XP
  • 8 ステップごとに勾配を同期するよう、local_sgd_steps を設定してください。
  • ローカル SGD コンテキストマネージャーをステップ実行してください。