1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie przez wzmacnianie z Gymnasium w Pythonie

Connected

ćwiczenie

Interakcja ze środowiskiem Frozen Lake

Teraz będziesz poruszać się po środowisku Frozen Lake – siatce, w której akcje przesuwają agenta w określonych kierunkach. Przyjrzyj się uważnie środowisku i ręcznie zdefiniuj listę actions, która przeprowadzi agenta z punktu startowego (lewy górny róg) do celu (prawy dolny róg) bez wpadania w żadne dziury. W środowisku Frozen Lake akcje są reprezentowane następująco:

  • 0: lewo
  • 1: dół
  • 2: prawo
  • 3: góra

Po uruchomieniu kodu koniecznie przejrzyj wykresy, używając przycisków „Poprzedni wykres" i „Następny wykres", aby zobaczyć trasę agenta. Pomoże ci to zrozumieć kolejność akcji i ich efekty.

gym i plt zostały zaimportowane wraz z funkcją render() oraz zmienną env.

Instrukcje

100 XP
  • Obserwuj pozycję agenta po prawej stronie i zdefiniuj listę actions, która przeprowadzi go przez jezioro do celu.
  • Wykonaj każdą akcję z listy przy użyciu pętli for.
  • Wyrenderuj środowisko po każdej akcji, aby śledzić trasę agenta.