1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Reinforcement Learning với Gymnasium trong Python

Connected

Bài tập

Tương tác với môi trường Frozen Lake

Bây giờ bạn sẽ điều hướng trong môi trường Frozen Lake, một thế giới dạng lưới nơi các hành động đưa agent di chuyển theo các hướng xác định. Nhiệm vụ của bạn là quan sát kỹ môi trường và tự tay xác định một danh sách actions để đưa agent từ điểm bắt đầu (góc trên bên trái) đến mục tiêu (góc dưới bên phải) mà không rơi vào bất kỳ hố nào. Trong môi trường Frozen Lake, các hành động thường được biểu diễn như sau:

  • 0: trái
  • 1: xuống
  • 2: phải
  • 3: lên

Sau khi chạy mã, nhớ duyệt qua các biểu đồ để xem lộ trình đã đi bằng các nút 'Previous Plot' và 'Next Plot'. Điều này sẽ giúp bạn hiểu chuỗi hành động và kết quả của chúng.

gym và plt đã được nhập sẵn cùng với hàm render() và biến env.

Hướng dẫn

100 XP
  • Quan sát vị trí của agent ở bên phải và xác định một danh sách actions để điều hướng agent băng qua hồ đến mục tiêu.
  • Thực thi lần lượt từng hành động trong danh sách thông qua vòng lặp for.
  • Kết xuất (render) môi trường sau mỗi hành động để quan sát đường đi của agent.