Configurazione dell'ambiente e della rete neurale
Inizierai configurando l'ambiente che userai per tutto il corso: Lunar Lander, in cui un agente controlla i propulsori di un veicolo che tenta di atterrare sulla luna.
torch, torch.nn, torch.optim e gym sono già importati negli esercizi.
Questo esercizio fa parte del corso
Deep Reinforcement Learning in Python
Istruzioni dell'esercizio
- Inizializza l'ambiente Lunar Lander in
gym(LunarLander-v2). - Definisci un singolo livello di trasformazione lineare, con dimensione di input
dim_inputse dimensione di outputdim_outputs. - Istanzia la rete neurale con dimensione di input
8e dimensione di output4. - Fornisci all'ottimizzatore Adam i parametri.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Initiate the Lunar Lander environment
env = gym.____
class Network(nn.Module):
def __init__(self, dim_inputs, dim_outputs):
super(Network, self).__init__()
# Define a linear transformation layer
self.linear = ____
def forward(self, x):
return self.linear(x)
# Instantiate the network
network = ____
# Initialize the optimizer
optimizer = optim.Adam(____, lr=0.0001)
print("Network initialized as:\n", network)