Umgebung und Aufbau des neuronalen Netzes
Du beginnst damit, die Umgebung einzurichten, die du während des Kurses benutzen wirst: die Mondlande-Umgebung, in der ein Agent die Triebwerke eines Fahrzeugs steuert, das auf dem Mond landen will.
torch
Die Dateien torch.nn
, torch.optim
und gym
werden in deine Übungen importiert.
Diese Übung ist Teil des Kurses
Deep Reinforcement Learning in Python
Anleitung zur Übung
- Initialisiere die Umgebung des Lunar Landers auf
gym
(LunarLander-v2
). - Definiere eine einzelne lineare Transformationsschicht, mit der Eingangsdimension
dim_inputs
und der Ausgangsdimensiondim_outputs
. - Instanziere das neuronale Netz für die Eingangsdimension
8
und die Ausgangsdimension4
. - Gib dem Adam-Optimierer die Parameter vor.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Initiate the Lunar Lander environment
env = gym.____
class Network(nn.Module):
def __init__(self, dim_inputs, dim_outputs):
super(Network, self).__init__()
# Define a linear transformation layer
self.linear = ____
def forward(self, x):
return self.linear(x)
# Instantiate the network
network = ____
# Initialize the optimizer
optimizer = optim.Adam(____, lr=0.0001)
print("Network initialized as:\n", network)