Q-Network のアーキテクチャ

最初の Deep Reinforcement Learning エージェントを学習させる準備がほぼ整いました。完全なトレーニングループに進む前に、エージェントの意思決定と学習能力を支えるニューラルネットワークのアーキテクチャが必要です。

先ほどの演習で定義した汎用アーキテクチャを修正していきます。 torch と torch.nn は演習に読み込まれています。