IniziaInizia gratis

La coda a due estremità

Prendi confidenza con la struttura dati Double-Ended Queue, che userai come replay buffer.

La Double Ended Queue, o deque, è una coda a capacità limitata che "dimentica" gli elementi più vecchi man mano che se ne aggiungono di nuovi. Questo offre un'astrazione adatta a supportare il replay buffer.

Questo esercizio fa parte del corso

Deep Reinforcement Learning in Python

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

from collections import deque
buffer = deque(range(10))
print('Buffer initialized as:', buffer)
# Append 10 to the right of the buffer
buffer.____
print('Buffer after appending:', buffer)
Modifica ed esegui il codice