Die doppelendige Warteschlange
Mache dich mit der Double-Ended Queue Datenstruktur vertraut, die du als Wiedergabepuffer verwenden wirst.
Die Double Ended Queue ( deque
) ist eine Warteschlange mit begrenzter Kapazität, die ihre ältesten Einträge "vergisst", wenn im Laufe der Zeit neue Einträge hinzugefügt werden. Dies bietet eine gut geeignete Abstraktion, um den Replay-Buffer zu unterstützen.
Diese Übung ist Teil des Kurses
Deep Reinforcement Learning in Python
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
from collections import deque
buffer = deque(range(10))
print('Buffer initialized as:', buffer)
# Append 10 to the right of the buffer
buffer.____
print('Buffer after appending:', buffer)