Minibatch en DRL
In de context van PPO of A2C, waar verwijst een minibatch naar?
Deze oefening maakt deel uit van de cursus
Deep Reinforcement Learning in Python
Interactieve oefening met praktijkervaring
Zet theorie om in actie met een van onze interactieve oefeningen
Begin oefening