Entorno y configuración de la red neuronal

Empezarás configurando el entorno que utilizarás a lo largo del curso: el entorno Lunar Lander, en el que un agente controla los propulsores de un vehículo que intenta alunizar.

torch, torch.nn, torch.optim y gym se importan a tus ejercicios.

Este ejercicio forma parte del curso

Aprendizaje profundo por refuerzo en Python

Ver curso

Instrucciones de ejercicio

  • Inicializa el entorno del Lunar Lander en gym (LunarLander-v2).
  • Define una única capa de transformación lineal, con dimensión de entrada dim_inputs y dimensión de salida dim_outputs.
  • Instanciar la red neuronal para la dimensión de entrada 8 y la dimensión de salida 4.
  • Proporciona al optimizador Adam los parámetros.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Initiate the Lunar Lander environment
env = gym.____

class Network(nn.Module):
    def __init__(self, dim_inputs, dim_outputs):
        super(Network, self).__init__()
        # Define a linear transformation layer 
        self.linear = ____
    def forward(self, x):
        return self.linear(x)

# Instantiate the network
network = ____

# Initialize the optimizer
optimizer = optim.Adam(____, lr=0.0001)

print("Network initialized as:\n", network)