Minibatch en DRL
In de context van PPO of A2C, waar verwijst een minibatch naar?
Deze oefening maakt deel uit van de cursus
Deep Reinforcement Learning in Python
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen