1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Gymnasium 기반 Reinforcement Learning

Connected

연습 문제

Frozen Lake 환경과 상호작용하기

이제 Frozen Lake 환경을 탐색해 보겠습니다. 이 환경은 격자 기반의 세계로, 동작에 따라 에이전트가 특정 방향으로 이동해요. 여러분의 과제는 환경을 주의 깊게 살펴보고, 시작점(왼쪽 위)에서 목표점(오른쪽 아래)까지 구멍에 빠지지 않고 이동하도록 actions 목록을 수동으로 정의하는 것입니다. Frozen Lake에서 동작은 보통 다음과 같이 표현돼요:

  • 0: left
  • 1: down
  • 2: right
  • 3: up

코드를 실행한 후에는 'Previous Plot'과 'Next Plot' 버튼을 사용해 그래프를 넘겨 보면서 이동 경로를 꼭 확인하세요. 이렇게 하면 동작의 순서와 결과를 이해하는 데 도움이 됩니다.

gym과 plt가 render() 함수 및 env 변수와 함께 이미 임포트되어 있어요.

지침

100 XP
  • 오른쪽의 에이전트 위치를 관찰하고, 호수를 건너 목표에 도달하도록 actions 목록을 정의하세요.
  • for 루프를 통해 목록의 각 동작을 실행하세요.
  • 매 동작 후 환경을 렌더링하여 에이전트의 경로를 확인하세요.