1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Deep Reinforcement Learning v Pythonu

Connected

cvičení

Práce s diskrétními rozděleními

Brzy budeš pracovat se stochastickými politikami – tedy politikami, které reprezentují chování agenta v daném stavu jako pravděpodobnostní rozdělení přes akce.

PyTorch umožňuje reprezentovat diskrétní rozdělení pomocí třídy torch.distributions.Categorical, se kterou si teď vyzkoušíš pracovat.

Uvidíš, že vstupní čísla nemusí nutně tvořit součet 1 jako klasické pravděpodobnosti – normalizace proběhne automaticky.

Pokyny

100 XP
  • Vytvoř instanci kategorického pravděpodobnostního rozdělení.
  • Vezmi jeden vzorek z tohoto rozdělení.
  • Zadej 3 kladná čísla se součtem 1, která budou sloužit jako pravděpodobnosti.
  • Zadej 5 kladných čísel; Categorical je automaticky normalizuje na pravděpodobnosti.