1. Learn
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 Deep Reinforcement Learning

Connected

Exercise

Q-네트워크 아키텍처

이제 곧 첫 번째 Deep Reinforcement Learning 에이전트를 학습시킬 준비가 거의 끝났어요! 전체 학습 루프를 실행하기 전에, 에이전트의 의사결정과 학습을 이끌 신경망 아키텍처가 필요합니다.

이전 연습 문제에서 정의한 일반적인 아키텍처를 수정해 보세요. torch와 torch.nn은 이미 가져와져 있어요.

Instructions

100 XP
  • 첫 번째 은닉층을 인스턴스화하세요. 이 층의 입력은 차원이 state_size인 환경 상태입니다.
  • 출력층을 인스턴스화하세요. 이 층은 각 행동에 대한 Q-value를 제공하며 차원은 action_size입니다.
  • forward() 메서드를 완성하세요. 이 예제에서는 활성화 함수로 torch.relu를 사용하세요.