Minibatch und DRL
Was versteht man im Kontext von PPO oder A2C unter einem Minibatch?
Diese Übung ist Teil des Kurses
<Kurs>Deep Reinforcement Learning in Python</Kurs>Interaktive praktische Übung
Verwandle Theorie mit einer unserer interaktiven Übungen in die Praxis
Übung starten