베어본 DQN 훈련하기

이제 Lunar Lander 환경에서 베어본 DQN 알고리즘을 학습시켜 보세요. 아직은 최소한의 알고리즘이라 성능이 아주 좋지는 않겠지만, 이후에 차차 개선해 나가게 됩니다.

달 착륙선을 달에 착륙시키기 위한 첫걸음이라고 생각해 보세요!

앞에서 정의한 q_network 인스턴스를 사용할 수 있습니다.

이 강의의 모든 연습 문제에서는 각 에피소드가 끝날 때 에이전트의 성과를 출력해 주는 describe_episode() 함수가 파이썬 환경에 제공됩니다.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}연습 문제