MulaiMulai sekarang secara gratis

Penyiapan environment dan neural network

Anda akan mulai dengan menyiapkan environment yang akan digunakan sepanjang kursus: environment Lunar Lander, tempat sebuah agent mengendalikan pendorong untuk wahana yang mencoba mendarat di bulan.

torch, torch.nn, torch.optim, dan gym telah diimpor ke dalam latihan Anda.

Latihan ini adalah bagian dari kursus

Deep Reinforcement Learning dengan Python

Lihat Kursus

Petunjuk latihan

  • Inisialisasi environment Lunar Lander di gym (LunarLander-v2).
  • Definisikan satu lapisan transformasi linear, dengan dimensi masukan dim_inputs dan dimensi keluaran dim_outputs.
  • Instansiasikan Neural Network untuk dimensi masukan 8 dan dimensi keluaran 4.
  • Berikan parameter kepada optimizer Adam.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Initiate the Lunar Lander environment
env = gym.____

class Network(nn.Module):
    def __init__(self, dim_inputs, dim_outputs):
        super(Network, self).__init__()
        # Define a linear transformation layer 
        self.linear = ____
    def forward(self, x):
        return self.linear(x)

# Instantiate the network
network = ____

# Initialize the optimizer
optimizer = optim.Adam(____, lr=0.0001)

print("Network initialized as:\n", network)
Edit dan Jalankan Kode