Umgebung und Aufbau des neuronalen Netzes
Du beginnst damit, die Umgebung einzurichten, die du während des Kurses benutzen wirst: die Mondlande-Umgebung, in der ein Agent die Triebwerke eines Fahrzeugs steuert, das auf dem Mond landen will.

torchDie Dateien torch.nn, torch.optim und gym werden in deine Übungen importiert.
Diese Übung ist Teil des Kurses
<Kurs>Deep Reinforcement Learning in Python</Kurs>Übungsanweisungen
- Initialisiere die Umgebung des Lunar Landers auf
gym(LunarLander-v2). - Definiere eine einzelne lineare Transformationsschicht, mit der Eingangsdimension
dim_inputsund der Ausgangsdimensiondim_outputs. - Instanziere das neuronale Netz für die Eingangsdimension
8und die Ausgangsdimension4. - Gib dem Adam-Optimierer die Parameter vor.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Initiate the Lunar Lander environment
env = gym.____
class Network(nn.Module):
def __init__(self, dim_inputs, dim_outputs):
super(Network, self).__init__()
# Define a linear transformation layer
self.linear = ____
def forward(self, x):
return self.linear(x)
# Instantiate the network
network = ____
# Initialize the optimizer
optimizer = optim.Adam(____, lr=0.0001)
print("Network initialized as:\n", network)