Kiến trúc Q-Network

Bạn đã gần như sẵn sàng để huấn luyện agent Deep Reinforcement Learning đầu tiên! Trước khi chạy vòng lặp huấn luyện hoàn chỉnh, bạn cần một kiến trúc mạng nơ-ron để dẫn dắt quyết định của agent và khả năng học của nó.

Bạn sẽ chỉnh sửa kiến trúc tổng quát đã định nghĩa ở bài tập trước. torch và torch.nn đã được nhập sẵn trong bài tập này.