1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Deep Reinforcement Learning v Pythonu

Connected

cvičení

Hraní si s entropií

Pokud ses s pojmem entropie ještě nesetkal/a, pomůže si ho lépe představit na konkrétním příkladu.

Napíšeš funkci plot_probabilities, která přijímá seznam pravděpodobností jako argument. Vypočítá entropii a zobrazí pravděpodobnosti jako sloupcový graf.

Až si s entropií trochu pohraješ, zjistíš, že entropie je vyšší, když je rozdělení pravděpodobnosti rozloženo rovnoměrně přes mnoho akcí.

Třída torch.distribution.Categorical je ve tvém prostředí dostupná jako Categorical; tato třída má metodu .entropy(), která vrací entropii v natech.

Pokyny

100 XP
  • Získej entropii rozdělení pravděpodobnosti v natech.
  • Pro přehlednost převeď entropii z natů na bity.
  • Zkus jako vstup funkce použít jiný seznam.