LoslegenKostenlos starten

Umgebung und Aufbau des neuronalen Netzes

Du beginnst damit, die Umgebung einzurichten, die du während des Kurses benutzen wirst: die Mondlande-Umgebung, in der ein Agent die Triebwerke eines Fahrzeugs steuert, das auf dem Mond landen will.

torchDie Dateien torch.nn, torch.optim und gym werden in deine Übungen importiert.

Diese Übung ist Teil des Kurses

<Kurs>Deep Reinforcement Learning in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Initialisiere die Umgebung des Lunar Landers auf gym (LunarLander-v2).
  • Definiere eine einzelne lineare Transformationsschicht, mit der Eingangsdimension dim_inputs und der Ausgangsdimension dim_outputs.
  • Instanziere das neuronale Netz für die Eingangsdimension 8 und die Ausgangsdimension 4.
  • Gib dem Adam-Optimierer die Parameter vor.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Initiate the Lunar Lander environment
env = gym.____

class Network(nn.Module):
    def __init__(self, dim_inputs, dim_outputs):
        super(Network, self).__init__()
        # Define a linear transformation layer 
        self.linear = ____
    def forward(self, x):
        return self.linear(x)

# Instantiate the network
network = ____

# Initialize the optimizer
optimizer = optim.Adam(____, lr=0.0001)

print("Network initialized as:\n", network)
Code bearbeiten und ausführen