1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Deep Reinforcement Learning bằng Python

Connected

Bài tập

Kiến trúc Q-Network

Bạn đã gần như sẵn sàng để huấn luyện agent Deep Reinforcement Learning đầu tiên! Trước khi chạy vòng lặp huấn luyện hoàn chỉnh, bạn cần một kiến trúc mạng nơ-ron để dẫn dắt quyết định của agent và khả năng học của nó.

Bạn sẽ chỉnh sửa kiến trúc tổng quát đã định nghĩa ở bài tập trước. torch và torch.nn đã được nhập sẵn trong bài tập này.

Hướng dẫn

100 XP
  • Khởi tạo tầng ẩn đầu tiên; đầu vào của nó sẽ là state của môi trường, có kích thước state_size.
  • Khởi tạo tầng đầu ra; nó cung cấp các Q-value cho mỗi hành động, với kích thước action_size.
  • Hoàn thiện phương thức forward(); dùng hàm kích hoạt torch.relu cho ví dụ này.