1. Lära sig
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 Gymnasium 기반 Reinforcement Learning

Connected

exercise

사용자 지정 Frozen Lake MDP 구성 요소

제공된 그리드 월드 환경은 에이전트가 구멍을 피해 목표 지점까지 이동해야 하는 Frozen Lake 환경의 변형입니다. 이 환경을 분석하여 특정 질문에 답하고, MDP로 구성해 보세요.

가능하다면 환경을 시각적으로 살펴보거나, 미리 로드된 env 변수를 활용해 답해 보셔도 됩니다.

Instruktioner 1 / 4

undefined XP
    1
    2
    3
    4

Fråga

가능한 행동 수는 몇 개인가요?

Möjliga svar