Penyiapan environment dan neural network
Anda akan mulai dengan menyiapkan environment yang akan digunakan sepanjang kursus: environment Lunar Lander, tempat sebuah agent mengendalikan pendorong untuk wahana yang mencoba mendarat di bulan.
torch, torch.nn, torch.optim, dan gym telah diimpor ke dalam latihan Anda.
Latihan ini adalah bagian dari kursus
Deep Reinforcement Learning dengan Python
Petunjuk latihan
- Inisialisasi environment Lunar Lander di
gym(LunarLander-v2). - Definisikan satu lapisan transformasi linear, dengan dimensi masukan
dim_inputsdan dimensi keluarandim_outputs. - Instansiasikan Neural Network untuk dimensi masukan
8dan dimensi keluaran4. - Berikan parameter kepada optimizer Adam.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Initiate the Lunar Lander environment
env = gym.____
class Network(nn.Module):
def __init__(self, dim_inputs, dim_outputs):
super(Network, self).__init__()
# Define a linear transformation layer
self.linear = ____
def forward(self, x):
return self.linear(x)
# Instantiate the network
network = ____
# Initialize the optimizer
optimizer = optim.Adam(____, lr=0.0001)
print("Network initialized as:\n", network)