La coda a due estremità
Prendi confidenza con la struttura dati Double-Ended Queue, che userai come replay buffer.
La Double Ended Queue, o deque, è una coda a capacità limitata che "dimentica" gli elementi più vecchi man mano che se ne aggiungono di nuovi. Questo offre un'astrazione adatta a supportare il replay buffer.
Questo esercizio fa parte del corso
Deep Reinforcement Learning in Python
esercizio interattivo pratico
Prova questo esercizio completando questo codice di esempio.
from collections import deque
buffer = deque(range(10))
print('Buffer initialized as:', buffer)
# Append 10 to the right of the buffer
buffer.____
print('Buffer after appending:', buffer)