1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Deep Reinforcement Learning v Pythonu

Connected

cvičení

Architektura Q-sítě

Jsi skoro připraven/a trénovat svého prvního agenta pro Deep Reinforcement Learning! Než se pustíš do kompletní trénovací smyčky, potřebuješ architekturu neuronové sítě, která bude řídit rozhodování agenta a jeho schopnost učit se.

Upravíš obecnou architekturu, kterou jsi definoval/a v předchozím cvičení. torch a torch.nn jsou v cvičení už naimportované.

Pokyny

100 XP
  • Vytvoř instanci první skryté vrstvy; jejím vstupem bude stav prostředí s dimenzí state_size.
  • Vytvoř instanci výstupní vrstvy; ta poskytuje Q-hodnoty pro každou akci s dimenzí action_size.
  • Dokonči metodu forward(); jako aktivační funkci použij torch.relu.