cvičení

Nastavení prostředí a neuronové sítě

Začneme nastavením prostředí, které budeš používat v celém kurzu: prostředí Lunar Lander, ve kterém agent ovládá trysky vozidla pokoušejícího se přistát na Měsíci.

torch, torch.nn, torch.optim a gym jsou v cvičeních již naimportovány.

Pokyny

100 XP

Inicializuj prostředí Lunar Lander v gym (LunarLander-v2).
Definuj jednu vrstvu lineární transformace se vstupní dimenzí dim_inputs a výstupní dimenzí dim_outputs.
Vytvoř instanci neuronové sítě se vstupní dimenzí 8 a výstupní dimenzí 4.
Předej optimalizátoru Adam parametry sítě.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení