Penyiapan environment dan neural network
Anda akan mulai dengan menyiapkan environment yang akan digunakan sepanjang kursus: environment Lunar Lander, tempat sebuah agent mengendalikan pendorong untuk wahana yang mencoba mendarat di bulan.
torch, torch.nn, torch.optim, dan gym telah diimpor ke dalam latihan Anda.
Latihan ini merupakan bagian dari kursus
Deep Reinforcement Learning dengan Python
Instruksi latihan
- Inisialisasi environment Lunar Lander di
gym(LunarLander-v2). - Definisikan satu lapisan transformasi linear, dengan dimensi masukan
dim_inputsdan dimensi keluarandim_outputs. - Instansiasikan Neural Network untuk dimensi masukan
8dan dimensi keluaran4. - Berikan parameter kepada optimizer Adam.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Initiate the Lunar Lander environment
env = gym.____
class Network(nn.Module):
def __init__(self, dim_inputs, dim_outputs):
super(Network, self).__init__()
# Define a linear transformation layer
self.linear = ____
def forward(self, x):
return self.linear(x)
# Instantiate the network
network = ____
# Initialize the optimizer
optimizer = optim.Adam(____, lr=0.0001)
print("Network initialized as:\n", network)