De double-ended queue
Maak kennis met de Double-Ended Queue-gegevensstructuur die je gaat gebruiken als replaybuffer.
De Double-Ended Queue, of deque, is een wachtrij met beperkte capaciteit die zijn oudste items “vergeet” zodra er na verloop van tijd nieuwe items worden toegevoegd. Dit is een passende abstractie om de replaybuffer te ondersteunen.
Deze oefening maakt deel uit van de cursus
Deep Reinforcement Learning in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
from collections import deque
buffer = deque(range(10))
print('Buffer initialized as:', buffer)
# Append 10 to the right of the buffer
buffer.____
print('Buffer after appending:', buffer)