Ambiente e configuração da rede neural
Você começará configurando o ambiente que usará ao longo do curso: o ambiente Lunar Lander, em que um agente controla os propulsores de um veículo que tenta pousar na lua.
torch``torch.nn
, torch.optim
e gym
são importados para seus exercícios.
Este exercício faz parte do curso
Aprendizado por reforço profundo em Python
Instruções de exercício
- Inicialize o ambiente do Lunar Lander em
gym
(LunarLander-v2
). - Defina uma única camada de transformação linear, com dimensão de entrada
dim_inputs
e dimensão de saídadim_outputs
. - Instancie a rede neural para a dimensão de entrada
8
e a dimensão de saída4
. - Forneça os parâmetros ao otimizador Adam.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Initiate the Lunar Lander environment
env = gym.____
class Network(nn.Module):
def __init__(self, dim_inputs, dim_outputs):
super(Network, self).__init__()
# Define a linear transformation layer
self.linear = ____
def forward(self, x):
return self.linear(x)
# Instantiate the network
network = ____
# Initialize the optimizer
optimizer = optim.Adam(____, lr=0.0001)
print("Network initialized as:\n", network)