1. 학습
  2. /
  3. 강의
  4. /
  5. Reinforcement Learning với Gymnasium trong Python

Connected

연습 문제

Các thành phần MDP của Frozen Lake tùy chỉnh

Môi trường grid world được cung cấp là một biến thể của môi trường Frozen Lake, nơi một tác tử phải đi đến mục tiêu và tránh các hố. Nhiệm vụ của bạn là phân tích môi trường này và mô hình hóa nó như một MDP bằng cách trả lời các câu hỏi cụ thể.

Bạn có thể trả lời bằng cách quan sát trực quan môi trường (khi phù hợp), hoặc sử dụng biến env đã được nạp sẵn cho bạn.

지침 1/4

undefined XP
    1
    2
    3
    4

질문

Chúng ta có bao nhiêu hành động?

가능한 답변