1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Deep Reinforcement Learning v Pythonu

Connected

cvičení

Fronta s dvojitým koncem

Seznam se s datovou strukturou fronty s dvojitým koncem, kterou budeš používat jako replay buffer.

Fronta s dvojitým koncem, neboli deque, je fronta s omezenou kapacitou, která postupně „zapomíná" nejstarší položky, když přibývají nové. Jde o ideální abstrakci pro implementaci replay bufferu.

Instrukce 1/3

undefined XP
  • 1
    • Přidej celé číslo 10 na pravou stranu fronty s dvojitým koncem.
  • 2
    • Nastav maximální kapacitu 5 jako argument maxlen a sleduj, co se stane, když se pokusíme přidat položku nad rámec kapacity fronty.
  • 3
    • Náhodně vyber tři položky z bufferu.