1. 학습
  2. /
  3. 강의
  4. /
  5. PyTorch로 AI 모델 효율적으로 학습시키기

Connected

연습 문제

Accelerator와 함께하는 Adafactor

Trainer와 Adafactor를 함께 사용해 언어 번역 모델을 적은 메모리로 학습하는 개념 검증을 완료했습니다. 이번에는 Accelerator를 활용해 학습 루프를 직접 구성해 보겠습니다. Adafactor를 사용하는 학습 루프를 만들어 보세요!

compute_optimizer_size() 함수는 미리 정의되어 있습니다. 학습 객체인 model, train_dataloader, accelerator도 미리 로드되어 있으며, Adafactor는 torch.optim에서 미리 임포트되어 있습니다.

지침

100 XP
  • optimizer를 정의할 때 모델 파라미터를 Adafactor에 전달하세요.
  • 옵티마이저 상태를 전달하여 크기를 출력하세요.