Environnement et configuration du réseau neuronal
Vous commencerez par configurer l'environnement que vous utiliserez tout au long du cours : l'environnement Lunar Lander, dans lequel un agent contrôle les propulseurs d'un véhicule qui tente d'atterrir sur la Lune.

torch``torch.nn, torch.optim et gym sont importés dans vos exercices.
Cet exercice fait partie du cours
Apprentissage par renforcement profond en Python
Instructions
- Veuillez initialiser l'environnement Lunar Lander dans
gym(LunarLander-v2). - Définissez une seule couche de transformation linéaire, avec une dimension d'entrée
dim_inputset une dimension de sortiedim_outputs. - Instancier le réseau neuronal pour la dimension d'entrée
8et la dimension de sortie4. - Veuillez fournir les paramètres à l'optimiseur Adam.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Initiate the Lunar Lander environment
env = gym.____
class Network(nn.Module):
def __init__(self, dim_inputs, dim_outputs):
super(Network, self).__init__()
# Define a linear transformation layer
self.linear = ____
def forward(self, x):
return self.linear(x)
# Instantiate the network
network = ____
# Initialize the optimizer
optimizer = optim.Adam(____, lr=0.0001)
print("Network initialized as:\n", network)