Inizia subitoInizia gratis

La coda a due estremità

Prendi confidenza con la struttura dati Double-Ended Queue, che userai come replay buffer.

La Double Ended Queue, o deque, è una coda a capacità limitata che "dimentica" gli elementi più vecchi man mano che se ne aggiungono di nuovi. Questo offre un'astrazione adatta a supportare il replay buffer.

Questo esercizio fa parte del corso

Deep Reinforcement Learning in Python

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

from collections import deque
buffer = deque(range(10))
print('Buffer initialized as:', buffer)
# Append 10 to the right of the buffer
buffer.____
print('Buffer after appending:', buffer)
Modifica ed esegui il codice