1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Reinforcement Learning với Gymnasium trong Python

Connected

Bài tập

Khám phá không gian trạng thái và hành động

Môi trường Cliff Walking mô phỏng một tác tử băng qua lưới ô từ điểm bắt đầu đến mục tiêu, đồng thời tránh rơi xuống vực. Nếu người chơi di chuyển vào vị trí vách đá, họ sẽ bị đưa về vị trí bắt đầu. Người chơi tiếp tục di chuyển cho đến khi chạm mục tiêu, khi đó tập sẽ kết thúc. Nhiệm vụ của bạn là khám phá không gian trạng thái và không gian hành động của môi trường này.

Image showing an animation for the cliff walking environment.

Hướng dẫn

100 XP
  • Tạo một thể hiện môi trường cho Cliff Walking với ID môi trường CliffWalking.
  • Tính kích thước không gian hành động và lưu vào num_actions.
  • Tính kích thước không gian trạng thái và lưu vào num_states.