1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Deep Reinforcement Learning bằng Python

Connected

Bài tập

Hàng đợi hai đầu (double-ended queue)

Làm quen với cấu trúc dữ liệu Double-Ended Queue mà bạn sẽ dùng làm replay buffer.

Double-Ended Queue, hay deque, là một hàng đợi có dung lượng giới hạn, sẽ “quên” các phần tử cũ nhất khi phần tử mới được thêm vào theo thời gian. Điều này tạo ra một lớp trừu tượng rất phù hợp để làm replay buffer.

Hướng dẫn 1/3

undefined XP
  • 1
    • Thêm số nguyên 10 vào phía bên phải của Double-Ended Queue.
  • 2
    • Đặt dung lượng tối đa là 5 bằng đối số maxlen; quan sát điều gì xảy ra khi bạn cố gắng thêm vượt quá dung lượng của hàng đợi.
  • 3
    • Lấy ngẫu nhiên ba phần tử từ buffer.