IniziaInizia gratis

Configurazione dell'ambiente e della rete neurale

Inizierai configurando l'ambiente che userai per tutto il corso: Lunar Lander, in cui un agente controlla i propulsori di un veicolo che tenta di atterrare sulla luna.

torch, torch.nn, torch.optim e gym sono già importati negli esercizi.

Questo esercizio fa parte del corso

Deep Reinforcement Learning in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Inizializza l'ambiente Lunar Lander in gym (LunarLander-v2).
  • Definisci un singolo livello di trasformazione lineare, con dimensione di input dim_inputs e dimensione di output dim_outputs.
  • Istanzia la rete neurale con dimensione di input 8 e dimensione di output 4.
  • Fornisci all'ottimizzatore Adam i parametri.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Initiate the Lunar Lander environment
env = gym.____

class Network(nn.Module):
    def __init__(self, dim_inputs, dim_outputs):
        super(Network, self).__init__()
        # Define a linear transformation layer 
        self.linear = ____
    def forward(self, x):
        return self.linear(x)

# Instantiate the network
network = ____

# Initialize the optimizer
optimizer = optim.Adam(____, lr=0.0001)

print("Network initialized as:\n", network)
Modifica ed esegui il codice