학습

/

강의

/

Python으로 배우는 Deep Reinforcement Learning

Connected

연습 문제

환경 및 신경망 설정

이번 강의 전반에서 사용할 환경을 먼저 설정해 볼게요. Lunar Lander 환경에서는 에이전트가 달 착륙을 시도하는 비행체의 추진기를 제어합니다.

torch, torch.nn, torch.optim, gym은 이미 이 연습 문제에 임포트되어 있어요.

지침

100 XP

gym에서 Lunar Lander 환경(LunarLander-v2)을 초기화하세요.
입력 차원 dim_inputs, 출력 차원 dim_outputs를 갖는 단일 선형 변환 레이어를 정의하세요.
입력 차원 8, 출력 차원 4에 맞춰 Neural Network를 인스턴스화하세요.
Adam 옵티마이저에 파라미터를 제공하세요.