1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Gymnasium 기반 Reinforcement Learning

Connected

연습 문제

사용자 지정 Frozen Lake MDP 구성 요소

제공된 그리드 월드 환경은 에이전트가 구멍을 피해 목표 지점까지 이동해야 하는 Frozen Lake 환경의 변형입니다. 이 환경을 분석하여 특정 질문에 답하고, MDP로 구성해 보세요.

가능하다면 환경을 시각적으로 살펴보거나, 미리 로드된 env 변수를 활용해 답해 보셔도 됩니다.

지침 1/4

undefined XP
    1
    2
    3
    4

질문

가능한 행동 수는 몇 개인가요?

가능한 답변