La coda a due estremità
Prendi confidenza con la struttura dati Double-Ended Queue, che userai come replay buffer.
La Double Ended Queue, o deque, è una coda a capacità limitata che "dimentica" gli elementi più vecchi man mano che se ne aggiungono di nuovi. Questo offre un'astrazione adatta a supportare il replay buffer.
Questo esercizio fa parte del corso
Deep Reinforcement Learning in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
from collections import deque
buffer = deque(range(10))
print('Buffer initialized as:', buffer)
# Append 10 to the right of the buffer
buffer.____
print('Buffer after appending:', buffer)