1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Deep Reinforcement Learning bằng Python

Connected

Bài tập

Sân chơi entropy

Nếu bạn chưa từng gặp khái niệm entropy, việc hình dung nó qua một ví dụ sẽ rất hữu ích.

Bạn sẽ xây dựng hàm plot_probabilities nhận một danh sách xác suất làm đối số. Hàm sẽ tính entropy và vẽ các xác suất dưới dạng biểu đồ cột.

Khi thử nghiệm với entropy, bạn sẽ thấy entropy cao hơn khi phân phối xác suất được dàn trải trên nhiều hành động.

Lớp torch.distribution.Categorical đã được nạp trong môi trường của bạn dưới tên Categorical; lớp này có phương thức .entropy() trả về entropy theo đơn vị nats.

Hướng dẫn

100 XP
  • Lấy entropy của phân phối xác suất theo đơn vị nats.
  • Để tiện so sánh, hãy chuyển entropy từ nats sang bits.
  • Thử dùng một danh sách khác làm đầu vào cho hàm.