1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Deep Reinforcement Learning v Pythonu

Connected

cvičení

Nastavení prostředí a neuronové sítě

Začneme nastavením prostředí, které budeš používat v celém kurzu: prostředí Lunar Lander, ve kterém agent ovládá trysky vozidla pokoušejícího se přistát na Měsíci.

torch, torch.nn, torch.optim a gym jsou v cvičeních již naimportovány.

Pokyny

100 XP
  • Inicializuj prostředí Lunar Lander v gym (LunarLander-v2).
  • Definuj jednu vrstvu lineární transformace se vstupní dimenzí dim_inputs a výstupní dimenzí dim_outputs.
  • Vytvoř instanci neuronové sítě se vstupní dimenzí 8 a výstupní dimenzí 4.
  • Předej optimalizátoru Adam parametry sítě.