Minibatch e DRL
Nel contesto di PPO o A2C, a cosa si riferisce un minibatch?
Questo esercizio fa parte del corso
Deep Reinforcement Learning in Python
esercizio interattivo pratico
Trasforma la teoria in pratica con uno dei nostri esercizi interattivi
Inizia esercizio