Q-네트워크 아키텍처

이제 곧 첫 번째 Deep Reinforcement Learning 에이전트를 학습시킬 준비가 거의 끝났어요! 전체 학습 루프를 실행하기 전에, 에이전트의 의사결정과 학습을 이끌 신경망 아키텍처가 필요합니다.

이전 연습 문제에서 정의한 일반적인 아키텍처를 수정해 보세요. torch와 torch.nn은 이미 가져와져 있어요.