Umgebung und Aufbau des neuronalen Netzes

Du beginnst damit, die Umgebung einzurichten, die du während des Kurses benutzen wirst: die Mondlande-Umgebung, in der ein Agent die Triebwerke eines Fahrzeugs steuert, das auf dem Mond landen will.

torchDie Dateien torch.nn, torch.optim und gym werden in deine Übungen importiert.

Diese Übung ist Teil des Kurses

Deep Reinforcement Learning in Python

Kurs anzeigen

Anleitung zur Übung

  • Initialisiere die Umgebung des Lunar Landers auf gym (LunarLander-v2).
  • Definiere eine einzelne lineare Transformationsschicht, mit der Eingangsdimension dim_inputs und der Ausgangsdimension dim_outputs.
  • Instanziere das neuronale Netz für die Eingangsdimension 8 und die Ausgangsdimension 4.
  • Gib dem Adam-Optimierer die Parameter vor.

Interaktive Übung zum Anfassen

Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.

# Initiate the Lunar Lander environment
env = gym.____

class Network(nn.Module):
    def __init__(self, dim_inputs, dim_outputs):
        super(Network, self).__init__()
        # Define a linear transformation layer 
        self.linear = ____
    def forward(self, x):
        return self.linear(x)

# Instantiate the network
network = ____

# Initialize the optimizer
optimizer = optim.Adam(____, lr=0.0001)

print("Network initialized as:\n", network)