Entorno y configuración de la red neuronal
Empezarás configurando el entorno que utilizarás a lo largo del curso: el entorno Lunar Lander, en el que un agente controla los propulsores de un vehículo que intenta alunizar.
torch
, torch.nn
, torch.optim
y gym
se importan a tus ejercicios.
Este ejercicio forma parte del curso
Aprendizaje profundo por refuerzo en Python
Instrucciones de ejercicio
- Inicializa el entorno del Lunar Lander en
gym
(LunarLander-v2
). - Define una única capa de transformación lineal, con dimensión de entrada
dim_inputs
y dimensión de salidadim_outputs
. - Instanciar la red neuronal para la dimensión de entrada
8
y la dimensión de salida4
. - Proporciona al optimizador Adam los parámetros.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Initiate the Lunar Lander environment
env = gym.____
class Network(nn.Module):
def __init__(self, dim_inputs, dim_outputs):
super(Network, self).__init__()
# Define a linear transformation layer
self.linear = ____
def forward(self, x):
return self.linear(x)
# Instantiate the network
network = ____
# Initialize the optimizer
optimizer = optim.Adam(____, lr=0.0001)
print("Network initialized as:\n", network)