Minibatch und DRL
Was versteht man im Kontext von PPO oder A2C unter einem Minibatch?
Diese Übung ist Teil des Kurses
Deep Reinforcement Learning in Python
Interaktive Übung
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.

Was versteht man im Kontext von PPO oder A2C unter einem Minibatch?
Diese Übung ist Teil des Kurses
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.