1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Reinforcement Learning với Gymnasium trong Python

Connected

Bài tập

Các thành phần MDP của Frozen Lake tùy chỉnh

Môi trường grid world được cung cấp là một biến thể của môi trường Frozen Lake, nơi một tác tử phải đi đến mục tiêu và tránh các hố. Nhiệm vụ của bạn là phân tích môi trường này và mô hình hóa nó như một MDP bằng cách trả lời các câu hỏi cụ thể.

Bạn có thể trả lời bằng cách quan sát trực quan môi trường (khi phù hợp), hoặc sử dụng biến env đã được nạp sẵn cho bạn.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4

Câu hỏi

Chúng ta có bao nhiêu hành động?

Các phương án trả lời