CommencerCommencer gratuitement

Environnement et configuration du réseau neuronal

Vous commencerez par configurer l'environnement que vous utiliserez tout au long du cours : l'environnement Lunar Lander, dans lequel un agent contrôle les propulseurs d'un véhicule qui tente d'atterrir sur la Lune.

torch``torch.nn, torch.optim et gym sont importés dans vos exercices.

Cet exercice fait partie du cours

Apprentissage par renforcement profond en Python

Afficher le cours

Instructions

  • Veuillez initialiser l'environnement Lunar Lander dans gym (LunarLander-v2).
  • Définissez une seule couche de transformation linéaire, avec une dimension d'entrée dim_inputs et une dimension de sortie dim_outputs.
  • Instancier le réseau neuronal pour la dimension d'entrée 8 et la dimension de sortie 4.
  • Veuillez fournir les paramètres à l'optimiseur Adam.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Initiate the Lunar Lander environment
env = gym.____

class Network(nn.Module):
    def __init__(self, dim_inputs, dim_outputs):
        super(Network, self).__init__()
        # Define a linear transformation layer 
        self.linear = ____
    def forward(self, x):
        return self.linear(x)

# Instantiate the network
network = ____

# Initialize the optimizer
optimizer = optim.Adam(____, lr=0.0001)

print("Network initialized as:\n", network)
Modifier et exécuter le code