Ambiente e configuração da rede neural

Você começará configurando o ambiente que usará ao longo do curso: o ambiente Lunar Lander, em que um agente controla os propulsores de um veículo que tenta pousar na lua.

torch``torch.nn, torch.optim e gym são importados para seus exercícios.

Este exercício faz parte do curso

Aprendizado por reforço profundo em Python

Ver Curso

Instruções de exercício

  • Inicialize o ambiente do Lunar Lander em gym (LunarLander-v2).
  • Defina uma única camada de transformação linear, com dimensão de entrada dim_inputs e dimensão de saída dim_outputs.
  • Instancie a rede neural para a dimensão de entrada 8 e a dimensão de saída 4.
  • Forneça os parâmetros ao otimizador Adam.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Initiate the Lunar Lander environment
env = gym.____

class Network(nn.Module):
    def __init__(self, dim_inputs, dim_outputs):
        super(Network, self).__init__()
        # Define a linear transformation layer 
        self.linear = ____
    def forward(self, x):
        return self.linear(x)

# Instantiate the network
network = ____

# Initialize the optimizer
optimizer = optim.Adam(____, lr=0.0001)

print("Network initialized as:\n", network)