1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Deep Reinforcement Learning bằng Python

Connected

Bài tập

Thiết lập môi trường và mạng nơ-ron

Bạn sẽ bắt đầu bằng cách thiết lập môi trường sẽ dùng xuyên suốt khóa học: môi trường Lunar Lander, nơi một agent điều khiển các động cơ đẩy của tàu để hạ cánh xuống Mặt Trăng.

torch, torch.nn, torch.optim và gym đã được import sẵn trong Bài tập của bạn.

Hướng dẫn

100 XP
  • Khởi tạo môi trường Lunar Lander trong gym (LunarLander-v2).
  • Định nghĩa một lớp biến đổi tuyến tính duy nhất, với kích thước đầu vào dim_inputs và kích thước đầu ra dim_outputs.
  • Khởi tạo Mạng Nơ-ron với kích thước đầu vào 8 và kích thước đầu ra 4.
  • Cung cấp các tham số của mạng cho bộ tối ưu Adam.