Umgebung und Aufbau des neuronalen Netzes
Du beginnst damit, die Umgebung einzurichten, die du während des Kurses benutzen wirst: die Mondlande-Umgebung, in der ein Agent die Triebwerke eines Fahrzeugs steuert, das auf dem Mond landen will.

torchDie Dateien torch.nn, torch.optim und gym werden in deine Übungen importiert.
Diese Übung ist Teil des Kurses
Deep Reinforcement Learning in Python
Anleitung zur Übung
- Initialisiere die Umgebung des Lunar Landers auf
gym(LunarLander-v2). - Definiere eine einzelne lineare Transformationsschicht, mit der Eingangsdimension
dim_inputsund der Ausgangsdimensiondim_outputs. - Instanziere das neuronale Netz für die Eingangsdimension
8und die Ausgangsdimension4. - Gib dem Adam-Optimierer die Parameter vor.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Initiate the Lunar Lander environment
env = gym.____
class Network(nn.Module):
def __init__(self, dim_inputs, dim_outputs):
super(Network, self).__init__()
# Define a linear transformation layer
self.linear = ____
def forward(self, x):
return self.linear(x)
# Instantiate the network
network = ____
# Initialize the optimizer
optimizer = optim.Adam(____, lr=0.0001)
print("Network initialized as:\n", network)