1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶDeep Reinforcement Learning

Connected

演習

Q-Network のアーキテクチャ

最初の Deep Reinforcement Learning エージェントを学習させる準備がほぼ整いました。完全なトレーニングループに進む前に、エージェントの意思決定と学習能力を支えるニューラルネットワークのアーキテクチャが必要です。

先ほどの演習で定義した汎用アーキテクチャを修正していきます。 torch と torch.nn は演習に読み込まれています。

指示

100 XP
  • 最初の隠れ層を作成します。入力は環境の状態で、次元は state_size です。
  • 出力層を作成します。各アクションの Q 値を出力し、次元は action_size です。
  • forward() メソッドを完成させます。この例では活性化関数に torch.relu を使用します。