Minibatch und DRL
Was versteht man im Kontext von PPO oder A2C unter einem Minibatch?
Diese Übung ist Teil des Kurses
Deep Reinforcement Learning in Python
Interaktive Übung
Setze die Theorie in einer unserer interaktiven Übungen in die Praxis um

Was versteht man im Kontext von PPO oder A2C unter einem Minibatch?
Diese Übung ist Teil des Kurses
Setze die Theorie in einer unserer interaktiven Übungen in die Praxis um