cvičení

Architektura Q-sítě

Jsi skoro připraven/a trénovat svého prvního agenta pro Deep Reinforcement Learning! Než se pustíš do kompletní trénovací smyčky, potřebuješ architekturu neuronové sítě, která bude řídit rozhodování agenta a jeho schopnost učit se.

Upravíš obecnou architekturu, kterou jsi definoval/a v předchozím cvičení. torch a torch.nn jsou v cvičení už naimportované.

Pokyny

100 XP

Vytvoř instanci první skryté vrstvy; jejím vstupem bude stav prostředí s dimenzí state_size.
Vytvoř instanci výstupní vrstvy; ta poskytuje Q-hodnoty pro každou akci s dimenzí action_size.
Dokonči metodu forward(); jako aktivační funkci použij torch.relu.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení