1. Обучение
  2. /
  3. Курса
  4. /
  5. Reinforcement Learning cu Gymnasium în Python

Connected

упражнение

Componentele MDP ale unui Frozen Lake personalizat

Mediul de tip grilă furnizat este o variantă a mediului Frozen Lake, în care un agent trebuie să navigheze până la o țintă evitând gropile. Sarcina ta este să analizezi acest mediu și să îl formulezi ca un MDP, răspunzând la câteva întrebări specifice.

Poți răspunde fie inspectând vizual mediul, acolo unde este posibil, fie utilizând variabila env pre-încărcată pentru tine.

Инструкции 1/4

undefined XP
    1
    2
    3
    4

Вопрос

Câte acțiuni avem?

Возможные ответы