Die doppelendige Warteschlange
Mache dich mit der Double-Ended Queue Datenstruktur vertraut, die du als Wiedergabepuffer verwenden wirst.
Die Double Ended Queue ( deque
) ist eine Warteschlange mit begrenzter Kapazität, die ihre ältesten Einträge "vergisst", wenn im Laufe der Zeit neue Einträge hinzugefügt werden. Dies bietet eine gut geeignete Abstraktion, um den Replay-Buffer zu unterstützen.
Diese Übung ist Teil des Kurses
Deep Reinforcement Learning in Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
from collections import deque
buffer = deque(range(10))
print('Buffer initialized as:', buffer)
# Append 10 to the right of the buffer
buffer.____
print('Buffer after appending:', buffer)