1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Reinforcement Learning với Gymnasium trong Python

Connected

Bài tập

Giải bài toán Frozen Lake 8x8 với Q-learning

Trong bài tập này, bạn sẽ áp dụng thuật toán Q-learning để học một chính sách tối ưu nhằm di chuyển trong môi trường Frozen Lake 8x8, lần này với điều kiện "trơn trượt" được bật. Thử thách này đưa vào các chuyển trạng thái ngẫu nhiên, khiến chuyển động của tác tử khó đoán hơn và mô phỏng sát thực tế hơn.

Một Q-table Q đã được khởi tạo và nạp sẵn cho bạn, cùng với hàm update_q_table() từ bài trước và một danh sách rỗng rewards_per_episode sẽ chứa tổng phần thưởng tích lũy qua mỗi tập (episode).

Hướng dẫn

100 XP
  • Với mỗi tập (episode), thực thi hành động đã chọn và quan sát phần thưởng cùng trạng thái tiếp theo.
  • Cập nhật Q-table.
  • Thêm total_reward vào danh sách rewards_per_episode.